基本Webscraping-返回:字符(0)错误
我刚开始学习R,在尝试第一次非教程性尝试时遇到了一些问题。我通过本教程学习了基本R: 我正试图从以下链接的项目中获取评论文本和星级: 我创建了以下程序,试图抓取我想要的两个项目:基本Webscraping-返回:字符(0)错误,r,web-scraping,rvest,R,Web Scraping,Rvest,我刚开始学习R,在尝试第一次非教程性尝试时遇到了一些问题。我通过本教程学习了基本R: 我正试图从以下链接的项目中获取评论文本和星级: 我创建了以下程序,试图抓取我想要的两个项目: library('rvest') review <- read_html("https://www.wildberries.ru/catalog/4234190/detail.aspx?targetUrl") body <- review %>% html_nodes(".body") %>%
library('rvest')
review <- read_html("https://www.wildberries.ru/catalog/4234190/detail.aspx?targetUrl")
body <- review %>% html_nodes(".body") %>% html_text()
body
rating <- review %>% html_nodes("#rating div") %>% html_attr("class")
rating
library('rvest')
查看%html\u文本()
身体
分级%html_节点(“#分级div”)%%>%html_属性(“类”)
评级
然而,这个程序只返回两个实例:character(0),我不知道如何解决这个问题。这是如此简单的抓取,我不确定这是怎么回事,我也不相信Javascript是罪魁祸首,因为所有的评论都是在页面打开时加载到hrml中的,而不是在以后
非常感谢您的任何帮助 JavaScript是一个问题,就好像你看到了你所抓取的内容,你需要的节点不在那里,因为它们是用JavaScript动态加载的(rvest无法运行)。@alistaire你建议如何前进?是否有您推荐的解决方案/库/教程可以让我获取这些项目?splashr或RSelenium可以获取HTML,如果您愿意,可以使用rvest进行解析。