R 如何从一个不断更新的网站上获取信息?
我想了解停车场中未占用停车位的信息。网站上的信息不断更新免费停车位的数量 因为我刚开始学习webscraping和R,所以我开始学习基础知识。 所以我试着用代码来获得IMDB电影的年度R 如何从一个不断更新的网站上获取信息?,r,web-scraping,rvest,R,Web Scraping,Rvest,我想了解停车场中未占用停车位的信息。网站上的信息不断更新免费停车位的数量 因为我刚开始学习webscraping和R,所以我开始学习基础知识。 所以我试着用代码来获得IMDB电影的年度 url2 <- "https://www.imdb.com/search/title/?count=100&release_date=2016,2016&title_type=feature" page2 <- read_html(url2) data2 <- page2 %&
url2 <- "https://www.imdb.com/search/title/?count=100&release_date=2016,2016&title_type=feature"
page2 <- read_html(url2)
data2 <- page2 %>%
html_node(".lister-item-year") %>%
html_text
data2
url2此页面使用javascript呈现,因此示例中的技术不适用。如果使用浏览器中的开发人员工具并检查“网络”选项卡上加载的文件,您将发现一个名为“index.php”的文件。这是一个包含停车信息的JSON文件
下载此文件将提供请求的信息。函数“jsonlite”库将访问该文件并将其转换为数据帧
library(jsonlite)
answer<-fromJSON("https://www.rosenheim.de/index.php?eID=jwParkingGetParkings")
answer
uid title parkings occupied free isOpened link
1 4 Reserve 0 0 --- FALSE 0
2 7 Reserve 0 0 --- FALSE 0
3 13 Reserve 0 0 --- FALSE 0
4 14 Reserve 0 0 --- FALSE 0
5 0 P1 Zentrum 257 253 4 TRUE 224
6 1 P2 KU'KO 138 133 5 TRUE 225
7 2 P3 Rathaus 31 29 2 TRUE 226
8 3 P4 Mitte 275 275 0 TRUE 227
9 5 P6 Salinplatz 232 148 84 TRUE 228
10 6 P7 Altstadt-Ost 82 108 0 TRUE 229
11 10 P8 Beilhack-Citydome 160 130 30 TRUE 230
12 8 P9 Am Klinikum 426 424 2 TRUE 1053
13 9 P10 Stadtcenter 56 54 2 TRUE 231
14 11 P11 Beilhack-Gießereistr. 155 155 --- FALSE 1151
15 12 P12 Bahnhof Nord 148 45 103 TRUE 1203
library(jsonlite)
答案此页面使用javascript呈现,因此示例中的技术不适用。如果使用浏览器中的开发人员工具并检查“网络”选项卡上加载的文件,您将发现一个名为“index.php”的文件。这是一个包含停车信息的JSON文件
下载此文件将提供请求的信息。函数“jsonlite”库将访问该文件并将其转换为数据帧
library(jsonlite)
answer<-fromJSON("https://www.rosenheim.de/index.php?eID=jwParkingGetParkings")
answer
uid title parkings occupied free isOpened link
1 4 Reserve 0 0 --- FALSE 0
2 7 Reserve 0 0 --- FALSE 0
3 13 Reserve 0 0 --- FALSE 0
4 14 Reserve 0 0 --- FALSE 0
5 0 P1 Zentrum 257 253 4 TRUE 224
6 1 P2 KU'KO 138 133 5 TRUE 225
7 2 P3 Rathaus 31 29 2 TRUE 226
8 3 P4 Mitte 275 275 0 TRUE 227
9 5 P6 Salinplatz 232 148 84 TRUE 228
10 6 P7 Altstadt-Ost 82 108 0 TRUE 229
11 10 P8 Beilhack-Citydome 160 130 30 TRUE 230
12 8 P9 Am Klinikum 426 424 2 TRUE 1053
13 9 P10 Stadtcenter 56 54 2 TRUE 231
14 11 P11 Beilhack-Gießereistr. 155 155 --- FALSE 1151
15 12 P12 Bahnhof Nord 148 45 103 TRUE 1203
library(jsonlite)
回答