如何在R中刮取javascript表？_Javascript_R_Web Scraping

如何在R中刮取javascript表？

javascript r web-scraping

如何在R中刮取javascript表？,javascript,r,web-scraping,Javascript,R,Web Scraping,我想从自行车上刮一张桌子：我的目标是一次获取所有zip文件的URL，而不是手动键入所有日期并每次下载一个。由于该网页每月更新一次，每次我运行该功能时，我都希望能够获得所有最新的数据文件我首先尝试使用Rvest和XML包，然后意识到该网页包含html和由javascript函数生成的表。这就是问题所在非常感谢您的帮助，如果我能提供更多信息，请告诉我。如果我转到（只有根目录，没有index.html），我会得到一个简单的XML文件。如果要解析XML，则相关元素为Key（大写K，小写y），但我只

我想从自行车上刮一张桌子：

我的目标是一次获取所有zip文件的URL，而不是手动键入所有日期并每次下载一个。由于该网页每月更新一次，每次我运行该功能时，我都希望能够获得所有最新的数据文件

我首先尝试使用Rvest和XML包，然后意识到该网页包含html和由javascript函数生成的表。这就是问题所在

非常感谢您的帮助，如果我能提供更多信息，请告诉我。

如果我转到（只有根目录，没有

index.html

），我会得到一个简单的XML文件。如果要解析XML，则相关元素为

Key

（大写K，小写y），但我只搜索纯文本，即：忽略XML，将其视为简单的文本文件，获取

和

之间的每个字符串，并将其视为文件名和前缀

https://s3.amazonaws.com/tripdata/

获取它

第一个条目看起来是全部的（170 MB），因此您可能可以单独使用。

您可能需要使用。