R 导致此特定错误消息的语法错误是什么?

R 导致此特定错误消息的语法错误是什么?,r,web-scraping,dplyr,rvest,R,Web Scraping,Dplyr,Rvest,我正在RStudio中使用R,我有一个R脚本来执行网页抓取。运行以下特定行时,我遇到一条错误消息: review<-ta1 %>% html_node("body") %>% xml_find_all("//div[contains@class,'location-review-review']") 注意:我的R脚本中加载了dplyr和rvest库 我在StackOverflow上查看了以下问题的答案: 我觉

我正在
RStudio
中使用
R
,我有一个
R
脚本来执行网页抓取。运行以下特定行时,我遇到一条错误消息:

      review<-ta1 %>%
              html_node("body") %>%
              xml_find_all("//div[contains@class,'location-review-review']")
注意:我的
R
脚本中加载了
dplyr
rvest

我在
StackOverflow
上查看了以下问题的答案:

我觉得我的解决方案与Richard Border对上述问题的回答有关。然而,我很难根据这个答案找出如何更正我的
R
语法

谢谢你调查我的问题

添加的ta1样品:

{xml_document}
<html lang="en" xmlns:og="http://opengraphprotocol.org/schema/">
[1] <head>\n<meta http-equiv="content-type" content="text/html; charset=utf-8">\n<link rel="icon" id="favicon"  ...
[2] <body class="rebrand_2017 desktop_web Hotel_Review  js_logging" id="BODY_BLOCK_JQUERY_REFLOW" data-tab="TAB ...
{xml\u document}

[1] \n\n我将在这里做一些假设,因为您的帖子没有包含足够的信息来生成可复制的示例

首先,我猜您正在尝试删除TripAdvisor,因为id和class字段与该站点匹配,并且您的变量名为
ta1

其次,我假设你正在尝试获取每一篇评论的文本和每一篇评论的星星数,因为这是你似乎要寻找的每一个类中的相关可刮信息

首先,我需要获得我自己版本的
ta1
变量,因为它不能从您编辑的版本复制

库(httr)
图书馆(rvest)
库(xml2)
图书馆(magrittr)
图书馆(tibble)
"https://www.tripadvisor.co.uk/"                          %>% 
粘贴0(“酒店审查-g186534-d192422-审查-”)%>%
paste0(“格拉斯哥万豪酒店-Glasgow\u Scotland.html”)->url
ta1%GET%>%read\u html
现在为感兴趣的数据编写正确的XPath

文本包含评论的元素的xpath xpath1%#提取文本 摘录(!equals(,“阅读更多”)->评论#删除“空白”评论
与之相关的明星评级如下:

ta1%>%
xml_find_all(粘贴0(xpath2,xpath3))%>%
xml属性(“类”)%%>%
strsplit(“”)%%>%
lappy(函数(x)x[长度(x)])%>%
as.numeric%>%
将_除以(10)->星
我们的结果如下所示:

tibble(评级=星级,审核=审核)
##一个tibble:5x2
#评级审查
#                                                                                                  
#我们中有17个人参加了萨图岛的圣诞晚会~
#2 4“上周末我们在att住了两晚~
#3 3住得很好,但没有备存~
#4.3预订了一晚的圣诞购物~
#5月4日在这里参加了一个慈善午餐会~

你能添加一个
ta1
的样本吗?@NelsonGon ta1 sample added你能添加一个可复制的样本吗?类似于
ta1=…
的东西会引发这个错误。你是个天才!正是我所做的。你让我开心了一天!非常感谢!我尝试将TIBLE转换为数据帧,如下所示:tibble1@user3115933 您确定这不仅仅是因为数据帧在控制台中的显示方式吗?如果尝试
df1$review
df$review[1]
,会发生什么情况?
{xml_document}
<html lang="en" xmlns:og="http://opengraphprotocol.org/schema/">
[1] <head>\n<meta http-equiv="content-type" content="text/html; charset=utf-8">\n<link rel="icon" id="favicon"  ...
[2] <body class="rebrand_2017 desktop_web Hotel_Review  js_logging" id="BODY_BLOCK_JQUERY_REFLOW" data-tab="TAB ...