Html rvest-在1个标记中刮取2个类_Html_R_Web Scraping_Scrape_Rvest - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/70.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Html rvest-在1个标记中刮取2个类_Html_R_Web Scraping_Scrape_Rvest - Fatal编程技术网

Html rvest-在1个标记中刮取2个类

html r web-scraping

Html rvest-在1个标记中刮取2个类,html,r,web-scraping,scrape,rvest,Html,R,Web Scraping,Scrape,Rvest,我是个新手。如何提取标记中有2个类名或只有1个类名的元素这是我的代码和问题： doc <- paste("<html>", "<body>", "<span class='a1 b1'> text1 </span>", "<span class='b1'> text2 </span>", "</body>

我是个新手。如何提取标记中有2个类名或只有1个类名的元素

这是我的代码和问题：

doc <- paste("<html>",
             "<body>",
             "<span class='a1 b1'> text1 </span>",
             "<span class='b1'> text2 </span>",
             "</body>",
             "</html>"
            )
library(rvest)
read_html(doc) %>% html_nodes(".b1")  %>% html_text()
#output: text1, text2
#what i want: text2

#I also want to extract only elements with 2 class names
read_html(doc) %>% html_nodes(".a1 .b1") %>% html_text()
# Output that i want: text1

有人可以帮忙吗？

您可以使用css选择器，如下所示：

选择类包含

b1

非

a1

：

read_html(doc) %>% html_nodes(".b1:not(.a1)")
# {xml_nodeset (1)}
# [1] <span class="b1"> text2 </span>

read\u html（doc）%%>%html\u节点（“.b1:非（.a1）”）
#{xml_nodeset（1）}
#[1]文本2

或者使用属性选择器：

read_html(doc) %>% html_nodes("[class='b1']")
# {xml_nodeset (1)}
# [1] <span class="b1"> text2 </span>

read\u html（doc）%>%html\u节点（“[class='b1']”）
#{xml_nodeset（1）}
#[1]文本2

选择类包含以下两个部分：

read_html(doc) %>% html_nodes(".a1.b1")
# {xml_nodeset (1)}
# [1] <span class="a1 b1"> text1 </span>

read\u html（doc）%>%html\u节点（“.a1.b1”）
#{xml_nodeset（1）}
#[1]文本1

谢谢！对于第一个解决方案，什么是

：not（）

？它是1语法还是

：

可以与其他标记/类/id一起使用？

不是的字面意思。i、 e..类不应在括号中包含类，是的，您可以将其与标记名和id一起使用，如span.b1:not（.a1）。你可以查看更多信息。
read_html(doc) %>% html_nodes(".a1.b1")
# {xml_nodeset (1)}
# [1] <span class="a1 b1"> text1 </span>




[r]相关文章推荐



                                                        
R 批读取netcdf文件并平均一个变量
rvariables 
用r中的时间序列数据帧生成ggplot图
r 
identify（）功能在R编程中的应用
rshiny 
将RStudio与远程R计算机连接
rhadoop 
HTMLPassing在一个大列表的循环中（18000个URL）
r 
R-ggplot2分类变量的重新排序（与重新排序函数有关的问题）
r 
尝试在R标记中获取浮动图形引用
r 
R 理解nls2和as.lm函数中的错误
r 
R：重复测量/随机效应模型的荟萃分析
r 
R 带区间的预测图
rplot 
根据精确的范围和R中的采样，可视化ggplot
r 
基于R中的因子在两个数据帧之间连接信息的有效方法（或如何避免R中的循环）
rloopsdataframe 
有没有一种方法可以在没有闪亮的服务器或用户拥有R的情况下创建交互式R文档？
rshiny 
R 使用函数循环行，前一行是下一行的输入
r 
在R中使用igraph生成k-正则图时，每个k-正则图都是唯一的和非随机的吗？
r 
使用从neuralnet（R）获得的权重手动计算输出
rneural-network 
使用dopar迭代运行foreach
rparallel-processing 
R 调整x轴日期以匹配“财政”年度的开始日期
r 
有没有办法查看RStudio中致命错误的日志？
我试图编写自己的包，它与一些C++代码连接。
我成功地构建并安装了该软件包，现在正在尝试运行该软件包的一个功能。
当尝试这样做时，我会看到一个弹出窗口，上面写着：
R Session Aborted
R encountered a fatal error.
The session was terminated.
r 
在R中重新格式化JSON文件
rjsonapi 
                                       





随机文章推荐



                                                        
ZSH提示符/RPrompt冲突
zsh 
ZSH制表符完成-don'；不要填写第一个文件
zsh 
Zsh 选项以获取当前工作目录
zsh 
zsh中的提示符以↑；255在错误命令之后？
zsh 
如何删除zsh中不包含给定文件的文件夹？
zsh 
Zsh 更新后prezto无法加载，这给了我一个解析错误，没有明显的原因
zsh 
在tmux中的zsh中，如何使页面向上/向下滚动
zsh 
让zsh向dircolors solarized致敬
zsh 
zsh-迭代脚本中使用参数匹配的文件
zsh 
用虚拟路径完成zsh
zsh 
在ZSH命令行中插入上一个命令的第一个字
zsh 
zsh如何解释shebangs中的非绝对路径？（WAS：为什么python3-i允许在shebang中使用非绝对路径？）
zsh 
Zsh 如何使用shell代码启动新的tmux会话？
zsh 
Zsh 函数使用替换重复最后一个命令
zsh 
使用zsh清除终端Mac OS后显示多行提示
zsh


                                        

                                        
                                        


                                                
                                                        [html]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Parse Platform
Deployment
Qt4
Ssl
Graphql
Security
Dynamics Crm
Computer Vision
C++
Sublimetext2
Streaming
Swift2
Neo4j
Autodesk Forge
Yaml
Apache Spark
Phpstorm
Matplotlib
Listview
Swagger
Stripe Payments
Bison
Xquery
String
Redis
Microservices
Time Complexity
Apache2
Libgdx
Report
Django Models
Arangodb
Orm
Windows Installer
Unity3d
Azure Cosmosdb
File Io
Keycloak
Stata
Openshift
Scheme
Tcp
Jaxb
Apache Pig
Ada
Hyperlink
Date
Uitableview
Frameworks
Prestashop
Msbuild
Hazelcast
Jdbc
Xna
Google Colaboratory
Error Handling
Shopify
Gnuplot
Artifactory
Cocoa Touch
Identityserver4
Tomcat
Asp.net Core
Xcode4
Xml
Numpy
Mono
Discord
Rspec
Windows Store Apps
Url Rewriting
Tfs
Oauth 2.0
Cakephp
Oracle Apex
Atom Editor
Google Sheets
Aws Lambda
Excel
Linux
Asp.net Mvc 4
Api
Twilio
Phpmyadmin
Jmeter
Video
Swing
Data Structures
Wolfram Mathematica
Ember.js
Llvm
Anaconda
Apache Camel
Jquery Mobile
Google Plus
Twitter
Discord.js
Angular6
Nosql
Jms
Xpages
Subsonic
Objective C
Redirect
Jestjs
Gremlin
Architecture
Asp.net
Influxdb
Text
Axapta
Apache
Ibm Mobilefirst
Import
Transactions
Xamarin.ios
Xamarin.android
Fluent Nhibernate
Windows Phone 8
Cuda
Pascal
Seo
Camera
Replace
Compilation
Menu
Datatables
Domain Driven Design
Ethereum
Doctrine
Serial Port
Macos
Mule
Grep
Unix
Migration
Xslt
Npm
Sip
Linq To Sql
Doctrine Orm
Drupal 7
Apache Flink
D
Primefaces
Wpf
Omnet++
Rally
Server
Yii2
Windows Phone 7
Notepad++
Sencha Touch
Three.js
Azure Devops
Canvas
Cluster Computing
Statistics
Network Programming
Web Services
Webpack
Cobol
Sed
Python 2.7
Select
Dask
Microsoft Graph Api
Mpi
Process
Hive
Ios
Cloud
Floating Point
Fortran
Apache Kafka
Clearcase
Utf 8
Cmake
Dictionary
Triggers
Google Maps Api 3
Isabelle
Silverlight 4.0
Safari
Jetty
Plone
Zsh
System Verilog
Actionscript 3
Gtk
Firebase
E Commerce
Geolocation
Sql Server 2005
Sharepoint 2010
Single Sign On
Certificate
Cmd
Akka
Compiler Errors
Google Drive Api


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网