R 网络垃圾足球数据一无所获
我想从网站上抓取比赛结果表 我正在使用带有以下代码的rvest包:R 网络垃圾足球数据一无所获,r,rvest,R,Rvest,我想从网站上抓取比赛结果表 我正在使用带有以下代码的rvest包: library(rvest) url.tournament <- "https://www.whoscored.com/Regions/247/Tournaments/36/Seasons/5967/Stages/15737/Fixtures/International-FIFA-World-Cup-2018" df.tournament <- read_html(url.tournament) %>%
library(rvest)
url.tournament <- "https://www.whoscored.com/Regions/247/Tournaments/36/Seasons/5967/Stages/15737/Fixtures/International-FIFA-World-Cup-2018"
df.tournament <- read_html(url.tournament) %>%
html_nodes(xpath='//*[@id="tournament-fixture-wrapper"]') %>%
html_nodes("table")
html_table()
库(rvest)
url.0%
html_节点(“表”)
html_表()
虽然没有提取任何元素。查看网站的源代码,您可以看到该表实际上并不存在于HTML源代码中,而是使用JavaScript动态生成的。这就是XPath查询返回空
的原因
因此,您不能依赖于{rvest}。在这种情况下,您需要使用动态刮刀,例如,它可以解释JavaScript。查看网站的源代码,您可以看到该表实际上并不存在于HTML源代码中-它是使用JavaScript动态生成的。这就是XPath查询返回空
的原因
因此,您不能依赖{rvest}在这种情况下,您需要使用动态刮刀,例如,它可以解释JavaScript。我尝试了几个版本的R,但出现安装错误:包'RSelenium'不可用(对于R版本3.4.1)@useR您需要按照我给您的链接中的安装说明进行操作,由于上游问题,最近从CRAN移除了包装。您还需要首先使用页面上给出的说明安装。我尝试了多个版本的R,但出现安装错误:包'RSelenium'不可用(对于R版本3.4.1)@useR您需要按照我给您的链接中的安装说明进行安装,由于上游问题,最近从CRAN移除了包装。您还需要首先按照页面上给出的说明安装。