R “错误”;xpath“U搜索”;在尝试用“刮”来刮网站之后;xml“查找所有”;

R “错误”;xpath“U搜索”;在尝试用“刮”来刮网站之后;xml“查找所有”;,r,web-scraping,rvest,httr,xml2,R,Web Scraping,Rvest,Httr,Xml2,我是R的新成员,我正在努力搜集一份包含巴西圣保罗州监狱囚犯人数和空缺的报告。我是一名记者,我向州政府索取这些信息,但他们不想给我 即使使用xml\u find\u all(),我也无法获取任何数据。我怎样才能刮网站 url <- "http://www.sap.sp.gov.br/" data <- url %>% httr::GET() %>% xml2::read_html() %>% xml2::xml_find_all(url, '//*[@i

我是R的新成员,我正在努力搜集一份包含巴西圣保罗州监狱囚犯人数和空缺的报告。我是一名记者,我向州政府索取这些信息,但他们不想给我

即使使用xml\u find\u all(),我也无法获取任何数据。我怎样才能刮网站

url <- "http://www.sap.sp.gov.br/"

data <- url %>%
  httr::GET() %>%
  xml2::read_html() %>%
  xml2::xml_find_all(url, '//*[@id="wrap"]/div/ul/ul/li[3]/div/div/span[1]/b')
url%
xml2::read_html()%>%
xml2::xml_find_all(url,'/*[@id=“wrap”]/div/ul/ul/li[3]/div/div/span[1]/b')
运行上述代码时,出现以下错误:

xpath_搜索中出错(x$node,x$doc,xpath=xpath,nsMap=ns, num_results=Inf):与STRSXP:[type=NULL]不兼容。“

需要删除的信息位于网站的右侧

  • 访问网址
  • 点击“阿尔瓦罗·德卡瓦略”
  • 在“Capacidade”(容量)和“popularção”(人口)之后获取数字 在每个监狱(如“阿尔瓦罗·德·卡瓦略”、“安德拉迪娜”), “Araraquara”等)

  • 谢谢。

    不幸的是,您无法使用此策略解决此问题。主网站很复杂,需要打开几个文件。您可以注意到其中一个文件是。这个js脚本将加载您需要的所有信息,但您必须使用字符串函数清除这些信息