如何在R中跟踪URL_R_Web Scraping

如何在R中跟踪URL

r web-scraping

如何在R中跟踪URL,r,web-scraping,R,Web Scraping,很抱歉标题不好，但我不知道如何表达“跟随” 我想从网站上远程下载csv文件。我可以通过使用RSelenium单击下载按钮来实现这一点，但我发现有一个直接链接可以为我启动下载。也就是说，我可以点击下载按钮，或者我可以直接进入我的浏览器，它会自动下载我尽量不使用RSelenium，因为它很笨重，但我不知道如何启动下载。由于我没有真正阅读html，所以没有任何东西从rvest中脱颖而出基本上，我在寻找一个R函数，比如gotour（'https://www.website.com/exportful

很抱歉标题不好，但我不知道如何表达“跟随”

我想从网站上远程下载csv文件。我可以通过使用RSelenium单击下载按钮来实现这一点，但我发现有一个直接链接可以为我启动下载。也就是说，我可以点击下载按钮，或者我可以直接进入我的浏览器，它会自动下载

我尽量不使用RSelenium，因为它很笨重，但我不知道如何启动下载。由于我没有真正阅读html，所以没有任何东西从rvest中脱颖而出

基本上，我在寻找一个R函数，比如

gotour（'https://www.website.com/exportfullcsv)

这将下载文件，就像我在浏览器中输入URL一样

既然你说你可以找到一个直接的URL，那么问题不是下载失败，而是你没有正确访问内容

我将一个小zip文件上载到个人网站，并运行以下代码：

dl您可以使用download.file（'https://www.website.com/exportfullcsv）
oops，是的，您需要download.file（'https://www.website.com/exportfullcsv“，”temp.csv“
如果需要登录才能下载，我想您可以选择RSelenium
。如果您可以使用基本身份验证，那么，也许httr:：GET
会很容易为您完成这项工作。如果您需要更多，您可能需要先进入rvest:：html\u会话
，然后进入rvest:：jump\u到
，以进入实际页面获取下载链接。我认为您可能需要RSelenium
的唯一时间是，是否有javascript阻碍了以编程方式确定链接的任何和所有努力。Size
表示您拥有内容，但它存储在从GET
返回的R对象内部。顺便说一下，如果你单独回答这个问题，我很乐意给你“接受”