Html rvest:提取span内容

Html rvest:提取span内容,html,web-scraping,rvest,Html,Web Scraping,Rvest,欢迎光临,我已经搜索了很长时间,但找不到如何使用rvest中的html_nodes()管理这个示例。我想从span中提取数据值,但只提取第一个数字。对于下面的html片段,它应该只返回:“504 012” 投票: 504 012 | 总额: 102万美元 我很乐意为您提供任何帮助。您可以指定name属性(“nv”)并使用html\u node()仅获取第一个匹配项 library(rvest) p <- '<p class="sort

欢迎光临,我已经搜索了很长时间,但找不到如何使用rvest中的html_nodes()管理这个示例。我想从span中提取数据值,但只提取第一个数字。对于下面的html片段,它应该只返回:“504 012”

投票: 504 012 | 总额: 102万美元


我很乐意为您提供任何帮助。

您可以指定name属性(“nv”)并使用
html\u node()
仅获取第一个匹配项

library(rvest)

p <- '<p class="sort-num_votes-visible">
                <span class="text-muted">Votes:</span>
                <span name="nv" data-value="504012">504 012</span>
                <span class="ghost">|</span>                
                <span class="text-muted">Gross:</span>
                <span name="nv" data-value="1 024 560">$1.02M</span>
</p>'

p %>% 
  read_html() %>% 
  html_node("span[name='nv']") %>% 
  html_text()

[1] "504 012"
库(rvest)
p%
读取html()%>%
html_节点(“span[name='nv']”)%>%
html_text()
[1] "504 012"
library(rvest)

p <- '<p class="sort-num_votes-visible">
                <span class="text-muted">Votes:</span>
                <span name="nv" data-value="504012">504 012</span>
                <span class="ghost">|</span>                
                <span class="text-muted">Gross:</span>
                <span name="nv" data-value="1 024 560">$1.02M</span>
</p>'

p %>% 
  read_html() %>% 
  html_node("span[name='nv']") %>% 
  html_text()

[1] "504 012"