R-Studio中使用的Web抓取数据

R-Studio中使用的Web抓取数据,r,web-scraping,R,Web Scraping,我想把数据从这个服务器站点拉到R-Studio。我是新手,所以根本不知道什么是可能的。如果您能提供编码方面的帮助,我们将不胜感激 对url进行如下的小修改将获取实际的表。将所有代码放在相同的位置(详细信息?点=63与示例?点=63) url你能不能把数据复制粘贴到excel表格中,然后读入R?rvest是R中一个流行的网页抓取软件包。但是,你想抓取的表格在这里是一个iframe,所以我认为rvest不能单独工作。您可能需要将rvest与splashr或rselenium.MLEN一起使用-当复

我想把数据从这个服务器站点拉到R-Studio。我是新手,所以根本不知道什么是可能的。如果您能提供编码方面的帮助,我们将不胜感激

对url进行如下的小修改将获取实际的表。将所有代码放在相同的位置(详细信息?点=63示例?点=63


url你能不能把数据复制粘贴到excel表格中,然后读入R?rvest是R中一个流行的网页抓取软件包。但是,你想抓取的表格在这里是一个iframe,所以我认为rvest不能单独工作。您可能需要将rvest与splashr或rselenium.MLEN一起使用-当复制的数据显示为一行文本时,屏幕一次只显示大约10天的数据。由于我需要多年的数据,所以我想尝试通过web获取实际的数据源。感谢Anil Kumar,这对于表中显示的默认数据非常有效。我真正想要实现的是清除隐藏在表/iframe后面的数据。
install.packages("rvest")
library('rvest')
install.packages('XML')
library('XML')
library("httr")


#Specifying the url for desired website to be scrapped
url <- 'http://hbrcdata.hbrc.govt.nz/hydrotel/cgi- 
        bin/hydwebserver.cgi/points/samples?point=679'





webpage <- read_html(url)

tbls <- html_nodes(webpage, "table")

head(tbls)


tbls_ls <- webpage %>%
           html_nodes("table") %>%
           html_table(fill = TRUE)

tbl <- as.data.frame(tbls_ls)

View(tbl)
http://hbrcdata.hbrc.govt.nz/hydrotel/cgi-bin/hydwebserver.cgi/points/details?point=63
url <- 'http://hbrcdata.hbrc.govt.nz/hydrotel/cgi-bin/HydWebServer.cgi/points/samples?point=63'