Html R(rvest)Web抓取多个页面

Html R(rvest)Web抓取多个页面,html,r,xml,web-scraping,rvest,Html,R,Xml,Web Scraping,Rvest,我期待着从费城民主党初选中获得结果。我想从网站上获取病房分区结果。我需要病房编号(如01-01)、候选人姓名(如LARRY KRASNER)以及每位候选人收到的百分比。本网站共有86页病房级别的结果: 使用SelectorGadget工具,每个工具的CSS如下所示: ward-division numbers = ".precinct-results-orangebox-title h1" name of candidates= ".precinct-result

我期待着从费城民主党初选中获得结果。我想从网站上获取病房分区结果。我需要病房编号(如01-01)、候选人姓名(如LARRY KRASNER)以及每位候选人收到的百分比。本网站共有86页病房级别的结果:

使用SelectorGadget工具,每个工具的CSS如下所示:

ward-division numbers = ".precinct-results-orangebox-title h1"
name of candidates= ".precinct-results-databox1 h1"
percent results= "#Datawrapper 16DEM .bar-percent"
当我最初尝试刮取网站数据时,我使用了以下代码:

#Read in the Data
daresults <- read_html (https://results.philadelphiavotes.com/ResultsSW.aspx type=CTY&map=CTY#page-1) 

#Ward-Division Numbers
warddiv<-daresults %>%
html_nodes(".precinct-results-orangebox-title h1")%>%
html_text() 

任何关于清理代码和创建循环以刮取所有86页的帮助都将不胜感激。谢谢。

看起来数据存储为JSON文件。从“网络”选项卡,从浏览器的开发人员工具,文件位于此处:

使用jsonlite或其他软件包读取文件并将文件解析为数据帧。
例如:

url<-"https://phillyresws.azurewebsites.us/ResultsAjax.svc/GetMapData?type=CTY&category=PREC&raceID=16&osn=16&county=04&party=DEM&LanguageID=1"
jsonlite::fromJSON(url)
url
url<-"https://phillyresws.azurewebsites.us/ResultsAjax.svc/GetMapData?type=CTY&category=PREC&raceID=16&osn=16&county=04&party=DEM&LanguageID=1"
jsonlite::fromJSON(url)