从类中提取数据=";节包装器“;使用Rvest

从类中提取数据=";节包装器“;使用Rvest,r,web-scraping,rvest,R,Web Scraping,Rvest,我确信前面已经回答了一个类似的问题,但我很想理解为什么Rvest无法从class=“section wrapper”提取数据。我使用的是R Studio,简而言之: anasj_103 = read_html("https://www.hockey-reference.com/boxscores/201810030SJS.html") ana_table = anasj_103 %>% html_node(xpath = '//*[@id="ANA_skaters"]') %&g

我确信前面已经回答了一个类似的问题,但我很想理解为什么Rvest无法从class=“section wrapper”提取数据。我使用的是R Studio,简而言之:

anasj_103 = read_html("https://www.hockey-reference.com/boxscores/201810030SJS.html")

ana_table = anasj_103 %>%
    html_node(xpath = '//*[@id="ANA_skaters"]') %>%
    html_table()

adv_ana = anasj_103 %>%
    html_node(xpath = '//*[@id="ANA_adv"]') %>%
    html_table()
返回的错误:UseMethod(“html_表”)中的错误: 没有适用于“xml\u缺失”类对象的“html\u表”的方法

ana_表在使用Xpath时工作正常,但在使用类似代码时,adv_ana会给出错误或不返回任何内容。我遇到了这个问题,在该类后面的div部分中有所有数据。因为我甚至不能在节包装器中返回基本文本,所以我确信这就是问题所在


有什么想法或解决办法吗

感谢QHarr的帮助。 上述问题通过以下方法解决:

table = anasjs_103 %>%
    html_nodes(xpath = '//comment()') %>%
    html_text() %>%
    paste(collapse = '') %>%
    read_html() %>%
    html_node('table#ANA_adv') %>%
    html_table()

感谢QHarr的帮助。 上述问题通过以下方法解决:

table = anasjs_103 %>%
    html_nodes(xpath = '//comment()') %>%
    html_text() %>%
    paste(collapse = '') %>%
    read_html() %>%
    html_node('table#ANA_adv') %>%
    html_table()

它又回来了。检查SO上的现有答案,查看R、rvest、刮擦注释。否。您感兴趣的部分作为html注释返回,因此在您尝试时无法通过解析器访问。明白-这是有道理的。谢谢请参阅,以获取几个示例。还有其他人,太好了!谢谢你在这里的帮助。这还是有点新,所以这节省了我很多时间。它会回来的。检查SO上的现有答案,查看R、rvest、刮擦注释。否。您感兴趣的部分作为html注释返回,因此在您尝试时无法通过解析器访问。明白-这是有道理的。谢谢请参阅,以获取几个示例。还有其他人,太好了!谢谢你在这里的帮助。这方面还是有点新,所以这节省了我很多时间。