R 从html#视图浏览网页

R 从html#视图浏览网页,r,web-scraping,R,Web Scraping,我正试图从下面的方面抓取内容 通过使用以下代码 Page <- read_html("http://d-portal.org/ctrack.html#view=act&aid=NL-1-PPR-100") country_ <- Page %>% html_nodes(".sector_code_text") %>% html_text() %>% paste(., collapse = &quo

我正试图从下面的方面抓取内容

通过使用以下代码

Page <- read_html("http://d-portal.org/ctrack.html#view=act&aid=NL-1-PPR-100")
  
country_ <- Page %>% 
  html_nodes(".sector_code_text") %>%
  html_text() %>%
  paste(., collapse = "")
Page%
html_text()%>%
粘贴(,折叠=)
我曾使用类似的代码从其他页面中刮取内容,但是,我肯定还是新手。 我想知道url中的#视图是否需要另一种方法来抓取内容。 是否有人经历过类似的事情和/或可以建议我如何继续


最佳Jens

此页面使用动态生成的内容
read_html
仅读取请求发送的源html。它不会运行javascript。您需要使用Selenium或类似phantomJS的无头浏览器。相应的R包考虑。我会首先尝试webdriver,因为前者需要设置和运行一个单独的Selenium服务器。Webdriver需要phantomJS,但安装起来要容易得多。

您想获取什么信息?这是一个国家的名称,可以在节点下找到。扇区代码文本。假设我正确阅读了html页面(使用firefox中的web developer工具)