R 如何从一个不断更新的网站上获取信息?

R 如何从一个不断更新的网站上获取信息?,r,web-scraping,rvest,R,Web Scraping,Rvest,我想了解停车场中未占用停车位的信息。网站上的信息不断更新免费停车位的数量 因为我刚开始学习webscraping和R,所以我开始学习基础知识。 所以我试着用代码来获得IMDB电影的年度 url2 <- "https://www.imdb.com/search/title/?count=100&release_date=2016,2016&title_type=feature" page2 <- read_html(url2) data2 <- page2 %&

我想了解停车场中未占用停车位的信息。网站上的信息不断更新免费停车位的数量

因为我刚开始学习webscraping和R,所以我开始学习基础知识。 所以我试着用代码来获得IMDB电影的年度

url2 <- "https://www.imdb.com/search/title/?count=100&release_date=2016,2016&title_type=feature"
page2 <- read_html(url2)

data2 <- page2 %>%
  html_node(".lister-item-year") %>%
  html_text
data2

url2此页面使用javascript呈现,因此示例中的技术不适用。如果使用浏览器中的开发人员工具并检查“网络”选项卡上加载的文件,您将发现一个名为“index.php”的文件。这是一个包含停车信息的JSON文件

下载此文件将提供请求的信息。函数“jsonlite”库将访问该文件并将其转换为数据帧

library(jsonlite)

answer<-fromJSON("https://www.rosenheim.de/index.php?eID=jwParkingGetParkings")
answer

   uid                     title parkings occupied free isOpened link
1    4                   Reserve        0        0  ---    FALSE    0
2    7                   Reserve        0        0  ---    FALSE    0
3   13                   Reserve        0        0  ---    FALSE    0
4   14                   Reserve        0        0  ---    FALSE    0
5    0                P1 Zentrum      257      253    4     TRUE  224
6    1                  P2 KU'KO      138      133    5     TRUE  225
7    2                P3 Rathaus       31       29    2     TRUE  226
8    3                  P4 Mitte      275      275    0     TRUE  227
9    5             P6 Salinplatz      232      148   84     TRUE  228
10   6           P7 Altstadt-Ost       82      108    0     TRUE  229
11  10      P8 Beilhack-Citydome      160      130   30     TRUE  230
12   8            P9 Am Klinikum      426      424    2     TRUE 1053
13   9           P10 Stadtcenter       56       54    2     TRUE  231
14  11 P11 Beilhack-Gießereistr.      155      155  ---    FALSE 1151
15  12          P12 Bahnhof Nord      148       45  103     TRUE 1203
library(jsonlite)

答案此页面使用javascript呈现,因此示例中的技术不适用。如果使用浏览器中的开发人员工具并检查“网络”选项卡上加载的文件,您将发现一个名为“index.php”的文件。这是一个包含停车信息的JSON文件

下载此文件将提供请求的信息。函数“jsonlite”库将访问该文件并将其转换为数据帧

library(jsonlite)

answer<-fromJSON("https://www.rosenheim.de/index.php?eID=jwParkingGetParkings")
answer

   uid                     title parkings occupied free isOpened link
1    4                   Reserve        0        0  ---    FALSE    0
2    7                   Reserve        0        0  ---    FALSE    0
3   13                   Reserve        0        0  ---    FALSE    0
4   14                   Reserve        0        0  ---    FALSE    0
5    0                P1 Zentrum      257      253    4     TRUE  224
6    1                  P2 KU'KO      138      133    5     TRUE  225
7    2                P3 Rathaus       31       29    2     TRUE  226
8    3                  P4 Mitte      275      275    0     TRUE  227
9    5             P6 Salinplatz      232      148   84     TRUE  228
10   6           P7 Altstadt-Ost       82      108    0     TRUE  229
11  10      P8 Beilhack-Citydome      160      130   30     TRUE  230
12   8            P9 Am Klinikum      426      424    2     TRUE 1053
13   9           P10 Stadtcenter       56       54    2     TRUE  231
14  11 P11 Beilhack-Gießereistr.      155      155  ---    FALSE 1151
15  12          P12 Bahnhof Nord      148       45  103     TRUE 1203
library(jsonlite)
回答