Html rvest:提取span内容
欢迎光临,我已经搜索了很长时间,但找不到如何使用rvest中的html_nodes()管理这个示例。我想从span中提取数据值,但只提取第一个数字。对于下面的html片段,它应该只返回:“504 012”Html rvest:提取span内容,html,web-scraping,rvest,Html,Web Scraping,Rvest,欢迎光临,我已经搜索了很长时间,但找不到如何使用rvest中的html_nodes()管理这个示例。我想从span中提取数据值,但只提取第一个数字。对于下面的html片段,它应该只返回:“504 012” 投票: 504 012 | 总额: 102万美元 我很乐意为您提供任何帮助。您可以指定name属性(“nv”)并使用html\u node()仅获取第一个匹配项 library(rvest) p <- '<p class="sort
投票:
504 012
|
总额:
102万美元
我很乐意为您提供任何帮助。您可以指定name属性(“nv”)并使用
html\u node()
仅获取第一个匹配项
library(rvest)
p <- '<p class="sort-num_votes-visible">
<span class="text-muted">Votes:</span>
<span name="nv" data-value="504012">504 012</span>
<span class="ghost">|</span>
<span class="text-muted">Gross:</span>
<span name="nv" data-value="1 024 560">$1.02M</span>
</p>'
p %>%
read_html() %>%
html_node("span[name='nv']") %>%
html_text()
[1] "504 012"
库(rvest)
p%
读取html()%>%
html_节点(“span[name='nv']”)%>%
html_text()
[1] "504 012"
library(rvest)
p <- '<p class="sort-num_votes-visible">
<span class="text-muted">Votes:</span>
<span name="nv" data-value="504012">504 012</span>
<span class="ghost">|</span>
<span class="text-muted">Gross:</span>
<span name="nv" data-value="1 024 560">$1.02M</span>
</p>'
p %>%
read_html() %>%
html_node("span[name='nv']") %>%
html_text()
[1] "504 012"