Rstudio Webscraping-Rvest返回字符(0)
我正在做一个本科项目,要求我从多个airbnb列表中收集以下数据 以下是一个例子: 我需要提供的以下数据是1位客人、1间卧室、1张床、1间浴室。 然而,当我使用CSS选择器工具时,我下面的路径是“..u b2fuovg” 当我运行以下代码时,将返回字符(0)Rstudio Webscraping-Rvest返回字符(0),r,web-scraping,rvest,R,Web Scraping,Rvest,我正在做一个本科项目,要求我从多个airbnb列表中收集以下数据 以下是一个例子: 我需要提供的以下数据是1位客人、1间卧室、1张床、1间浴室。 然而,当我使用CSS选择器工具时,我下面的路径是“..u b2fuovg” 当我运行以下代码时,将返回字符(0) library(rvest) library(dplyr) url1 <- read_html("https://www.airbnb.com.sg/rooms/49091?_set_bev_on_new_domain=15827
library(rvest)
library(dplyr)
url1 <- read_html("https://www.airbnb.com.sg/rooms/49091?_set_bev_on_new_domain=1582777903_ZWE4MTBjMGNmYmFh&source_impression_id=p3_1582778001_lB%2BjT8%2BWgIsL%2FrBV")
url1 %>%
html_nodes("._b2fuovg") %>%
html_text()
任何正确方向的建议或指导都将不胜感激!:) 我建议使用选择器小工具来确定要刮取的节点: 它通过点击你想要的信息来工作。也将包含的其他信息将以黄色显示。如果你不想要这些,点击它们把它们变成红色。你会注意到在屏幕底部有一个小条,上面有一些文字。这是您希望包含在
html\u nodes()
中的内容。在本例中,我得到了“1b3ij9t+div”。果然,这似乎奏效了:
url1 %>%
html_nodes("._1b3ij9t+ div") %>%
html_text()
[1] "1 guest · 1 bedroom · 1 bed · 1 bathroom"
url1 %>%
html_nodes("._1b3ij9t+ div") %>%
html_text()
[1] "1 guest · 1 bedroom · 1 bed · 1 bathroom"