如何在R中跟踪URL

如何在R中跟踪URL,r,web-scraping,R,Web Scraping,很抱歉标题不好,但我不知道如何表达“跟随” 我想从网站上远程下载csv文件。我可以通过使用RSelenium单击下载按钮来实现这一点,但我发现有一个直接链接可以为我启动下载。也就是说,我可以点击下载按钮,或者我可以直接进入我的浏览器,它会自动下载 我尽量不使用RSelenium,因为它很笨重,但我不知道如何启动下载。由于我没有真正阅读html,所以没有任何东西从rvest中脱颖而出 基本上,我在寻找一个R函数,比如gotour('https://www.website.com/exportful

很抱歉标题不好,但我不知道如何表达“跟随”

我想从网站上远程下载csv文件。我可以通过使用RSelenium单击下载按钮来实现这一点,但我发现有一个直接链接可以为我启动下载。也就是说,我可以点击下载按钮,或者我可以直接进入我的浏览器,它会自动下载

我尽量不使用RSelenium,因为它很笨重,但我不知道如何启动下载。由于我没有真正阅读html,所以没有任何东西从rvest中脱颖而出


基本上,我在寻找一个R函数,比如
gotour('https://www.website.com/exportfullcsv)
这将下载文件,就像我在浏览器中输入URL一样

既然你说你可以找到一个直接的URL,那么问题不是下载失败,而是你没有正确访问内容

我将一个小zip文件上载到个人网站,并运行以下代码:


dl您可以使用
download.file('https://www.website.com/exportfullcsv)
oops,是的,您需要
download.file('https://www.website.com/exportfullcsv“,”temp.csv“
如果需要登录才能下载,我想您可以选择
RSelenium
。如果您可以使用基本身份验证,那么,也许
httr::GET
会很容易为您完成这项工作。如果您需要更多,您可能需要先进入
rvest::html\u会话
,然后进入
rvest::jump\u到
,以进入实际页面获取下载链接。我认为您可能需要
RSelenium
的唯一时间是,是否有javascript阻碍了以编程方式确定链接的任何和所有努力。
Size
表示您拥有内容,但它存储在从
GET
返回的R对象内部。顺便说一下,如果你单独回答这个问题,我很乐意给你“接受”