如何在R中刮取javascript表?
我想从自行车上刮一张桌子: 我的目标是一次获取所有zip文件的URL,而不是手动键入所有日期并每次下载一个。由于该网页每月更新一次,每次我运行该功能时,我都希望能够获得所有最新的数据文件 我首先尝试使用Rvest和XML包,然后意识到该网页包含html和由javascript函数生成的表。这就是问题所在 非常感谢您的帮助,如果我能提供更多信息,请告诉我。如果我转到(只有根目录,没有如何在R中刮取javascript表?,javascript,r,web-scraping,Javascript,R,Web Scraping,我想从自行车上刮一张桌子: 我的目标是一次获取所有zip文件的URL,而不是手动键入所有日期并每次下载一个。由于该网页每月更新一次,每次我运行该功能时,我都希望能够获得所有最新的数据文件 我首先尝试使用Rvest和XML包,然后意识到该网页包含html和由javascript函数生成的表。这就是问题所在 非常感谢您的帮助,如果我能提供更多信息,请告诉我。如果我转到(只有根目录,没有index.html),我会得到一个简单的XML文件。如果要解析XML,则相关元素为Key(大写K,小写y),但我只
index.html
),我会得到一个简单的XML文件。如果要解析XML,则相关元素为Key
(大写K,小写y),但我只搜索纯文本,即:忽略XML,将其视为简单的文本文件,获取
和
之间的每个字符串,并将其视为文件名和前缀https://s3.amazonaws.com/tripdata/
获取它
第一个条目看起来是全部的(170 MB),因此您可能可以单独使用。您可能需要使用。