R 从html#视图浏览网页_R_Web Scraping

R 从html#视图浏览网页

r web-scraping

R 从html#视图浏览网页,r,web-scraping,R,Web Scraping,我正试图从下面的方面抓取内容通过使用以下代码 Page <- read_html("http://d-portal.org/ctrack.html#view=act&aid=NL-1-PPR-100") country_ <- Page %>% html_nodes(".sector_code_text") %>% html_text() %>% paste(., collapse = &quo

我正试图从下面的方面抓取内容

通过使用以下代码

Page <- read_html("http://d-portal.org/ctrack.html#view=act&aid=NL-1-PPR-100")
  
country_ <- Page %>% 
  html_nodes(".sector_code_text") %>%
  html_text() %>%
  paste(., collapse = "")

Page%
html_text（）%>%
粘贴（，折叠=）

我曾使用类似的代码从其他页面中刮取内容，但是，我肯定还是新手。我想知道url中的#视图是否需要另一种方法来抓取内容。是否有人经历过类似的事情和/或可以建议我如何继续

最佳Jens

此页面使用动态生成的内容

read_html

仅读取请求发送的源html。它不会运行javascript。您需要使用Selenium或类似phantomJS的无头浏览器。相应的R包考虑。我会首先尝试webdriver，因为前者需要设置和运行一个单独的Selenium服务器。Webdriver需要phantomJS，但安装起来要容易得多。

您想获取什么信息？这是一个国家的名称，可以在节点下找到。扇区代码文本。假设我正确阅读了html页面（使用firefox中的web developer工具）