R “错误”；xpath“U搜索”；在尝试用“刮”来刮网站之后；xml“查找所有”；_R_Web Scraping_Rvest_Httr_Xml2

R “错误”；xpath“U搜索”；在尝试用“刮”来刮网站之后；xml“查找所有”；

r web-scraping

R “错误”；xpath“U搜索”；在尝试用“刮”来刮网站之后；xml“查找所有”；,r,web-scraping,rvest,httr,xml2,R,Web Scraping,Rvest,Httr,Xml2,我是R的新成员，我正在努力搜集一份包含巴西圣保罗州监狱囚犯人数和空缺的报告。我是一名记者，我向州政府索取这些信息，但他们不想给我即使使用xml\u find\u all（），我也无法获取任何数据。我怎样才能刮网站 url <- "http://www.sap.sp.gov.br/" data <- url %>% httr::GET() %>% xml2::read_html() %>% xml2::xml_find_all(url, '//*[@i

我是R的新成员，我正在努力搜集一份包含巴西圣保罗州监狱囚犯人数和空缺的报告。我是一名记者，我向州政府索取这些信息，但他们不想给我

即使使用xml\u find\u all（），我也无法获取任何数据。我怎样才能刮网站

url <- "http://www.sap.sp.gov.br/"

data <- url %>%
  httr::GET() %>%
  xml2::read_html() %>%
  xml2::xml_find_all(url, '//*[@id="wrap"]/div/ul/ul/li[3]/div/div/span[1]/b')

url%
xml2:：read_html（）%>%
xml2:：xml_find_all（url，'/*[@id=“wrap”]/div/ul/ul/li[3]/div/div/span[1]/b'）

运行上述代码时，出现以下错误：

xpath_搜索中出错（x$node，x$doc，xpath=xpath，nsMap=ns， num_results=Inf）：与STRSXP:[type=NULL]不兼容。“

需要删除的信息位于网站的右侧

访问网址

点击“阿尔瓦罗·德卡瓦略”

在“Capacidade”（容量）和“popularção”（人口）之后获取数字在每个监狱（如“阿尔瓦罗·德·卡瓦略”、“安德拉迪娜”）， “Araraquara”等）

谢谢。

不幸的是，您无法使用此策略解决此问题。主网站很复杂，需要打开几个文件。您可以注意到其中一个文件是。这个js脚本将加载您需要的所有信息，但您必须使用字符串函数清除这些信息