R “错误”;xpath“U搜索”;在尝试用“刮”来刮网站之后;xml“查找所有”;
我是R的新成员,我正在努力搜集一份包含巴西圣保罗州监狱囚犯人数和空缺的报告。我是一名记者,我向州政府索取这些信息,但他们不想给我 即使使用xml\u find\u all(),我也无法获取任何数据。我怎样才能刮网站R “错误”;xpath“U搜索”;在尝试用“刮”来刮网站之后;xml“查找所有”;,r,web-scraping,rvest,httr,xml2,R,Web Scraping,Rvest,Httr,Xml2,我是R的新成员,我正在努力搜集一份包含巴西圣保罗州监狱囚犯人数和空缺的报告。我是一名记者,我向州政府索取这些信息,但他们不想给我 即使使用xml\u find\u all(),我也无法获取任何数据。我怎样才能刮网站 url <- "http://www.sap.sp.gov.br/" data <- url %>% httr::GET() %>% xml2::read_html() %>% xml2::xml_find_all(url, '//*[@i
url <- "http://www.sap.sp.gov.br/"
data <- url %>%
httr::GET() %>%
xml2::read_html() %>%
xml2::xml_find_all(url, '//*[@id="wrap"]/div/ul/ul/li[3]/div/div/span[1]/b')
url%
xml2::read_html()%>%
xml2::xml_find_all(url,'/*[@id=“wrap”]/div/ul/ul/li[3]/div/div/span[1]/b')
运行上述代码时,出现以下错误:
xpath_搜索中出错(x$node,x$doc,xpath=xpath,nsMap=ns,
num_results=Inf):与STRSXP:[type=NULL]不兼容。“
需要删除的信息位于网站的右侧
谢谢。不幸的是,您无法使用此策略解决此问题。主网站很复杂,需要打开几个文件。您可以注意到其中一个文件是。这个js脚本将加载您需要的所有信息,但您必须使用字符串函数清除这些信息