Javascript 黄花蔷薇
我正试图抓取一个网站,但是javascript给我带来了问题。我使用RSelenium访问我想要的页面,并且给定html,我可以解析它并获得我想要的数据。然而,这是我似乎无法解决的中间一步。以下是我所拥有的:Javascript 黄花蔷薇,javascript,r,web-scraping,Javascript,R,Web Scraping,我正试图抓取一个网站,但是javascript给我带来了问题。我使用RSelenium访问我想要的页面,并且给定html,我可以解析它并获得我想要的数据。然而,这是我似乎无法解决的中间一步。以下是我所拥有的: library('RSelenium') checkForServer() startServer() remDr <- remoteDriver(browserName="firefox", port=4444) remDr$open(silent=T) library('XML'
library('RSelenium')
checkForServer()
startServer()
remDr <- remoteDriver(browserName="firefox", port=4444)
remDr$open(silent=T)
library('XML')
url <- "http://racing.hkjc.com/racing/Info/Meeting/Results/english/Local/20141012/ST/1"
remDr$navigate(url)
elem <- remDr$findElement(using="div id", value="results") # PROBLEM HERE, CAN'T FIND A TAG THAT WORKS!
elemtxt <- elem$getElementAttribute("outerHTML")[[1]] # possible continuation
elemxml <- htmlTreeParse(elemtxt, useInternalNodes=T)
library('RSelenium'))
checkForServer()
startServer()
remDr类似于:
doc <- htmlParse(remDr$getPageSource()[[1]])
readHTMLTable(doc)
doc