使用R和PhantomJS的rajya sabha网站刮刀

使用R和PhantomJS的rajya sabha网站刮刀,r,web-scraping,phantomjs,R,Web Scraping,Phantomjs,我想删除网站上的pdf超链接: 不确定为什么这不会在工作目录中创建d.html文件? 然后在一个单独的环境中执行以下操作 system("F:/india political/rajya sabha floor debate/phantomjs-2.1.1-windows/phantomjs-2.1.1-windows/bin/phantomjs.exe get_RSdoc.js") withJS <- read_html('d.html') %>% html_nodes("

我想删除网站上的pdf超链接:

不确定为什么这不会在工作目录中创建d.html文件? 然后在一个单独的环境中执行以下操作

system("F:/india political/rajya sabha floor debate/phantomjs-2.1.1-windows/phantomjs-2.1.1-windows/bin/phantomjs.exe get_RSdoc.js")

withJS <- read_html('d.html') %>%
  html_nodes("//a") %>%
  html_text
system(“F:/india political/rajya sabha floor discussion/phantomjs-2.1.1-windows/phantomjs-2.1.1-windows/bin/phantomjs.exe get_RSdoc.js”)
含JS%
html_节点(“//a”)%>%
html_文本
我要提取的文本/链接位于href: 这是我希望在所有会话1:250中下载的内容

system("F:/india political/rajya sabha floor debate/phantomjs-2.1.1-windows/phantomjs-2.1.1-windows/bin/phantomjs.exe get_RSdoc.js")

withJS <- read_html('d.html') %>%
  html_nodes("//a") %>%
  html_text