R 刮取不会返回所需的数据
我正试图从网站上获取数据。我希望输入城市“Ahmedabad”和服务编号“3031629”,并提取提供账单详细信息的表格 我的代码很简单R 刮取不会返回所需的数据,r,rcurl,R,Rcurl,我正试图从网站上获取数据。我希望输入城市“Ahmedabad”和服务编号“3031629”,并提取提供账单详细信息的表格 我的代码很简单 a<- postForm("https://bill.torrentpower.com/billdetails.aspx", "ctl00$cph1$drpCity" = 1, "ctl00$cph1$txtServiceNo" = "3031629",
a<- postForm("https://bill.torrentpower.com/billdetails.aspx",
"ctl00$cph1$drpCity" = 1,
"ctl00$cph1$txtServiceNo" = "3031629",
.opts = list(ssl.verifypeer = FALSE)
)
write(a,file="a.html")
a这里的问题是,表是在页面加载后由JavaScript代码生成的,因此您将无法获得表的内容
这是抓取具有大量动态内容的信息的常见问题
解决这一问题的一项工作是使用RSelenium刺激web浏览器。
这将在您的R会话中使用web浏览器进行刺激,您可以使用各种方法浏览网页(有关信息,请参阅用户手册)
就我个人而言,我发现RSelenium与PhantomJS的组合最有用,因为我使用了大量JavaScript。或者,如果您发现使用R语法有点麻烦,您也可以单独使用PhantomJS