使用https URL登录后下载文件

使用https URL登录后下载文件,r,rvest,rcurl,httr,R,Rvest,Rcurl,Httr,我正在尝试下载一个excel文件,我有链接到该文件,但我必须先登录到该页面,然后才能下载该文件。我已经成功地通过了rvest、rcurl和httr的登录页面,但是在我登录后下载文件时遇到了极大的困难 url <- "https://website.com/console/login.do" download_url <- "https://website.com/file.xls" session <- html_session(url) form <- html_for

我正在尝试下载一个excel文件,我有链接到该文件,但我必须先登录到该页面,然后才能下载该文件。我已经成功地通过了rvest、rcurl和httr的登录页面,但是在我登录后下载文件时遇到了极大的困难

url <- "https://website.com/console/login.do"
download_url <- "https://website.com/file.xls"
session <- html_session(url)
form <- html_form(session)[[1]]

filled_form <- set_values(form,
                          userid = user,
                          password = pass)

## Save main page url
main_page <- submit_form(session, filled_form)

download.file(download_url, "./file.xls", method = "curl")

url有人在/r/rstats上找到了这个问题的答案。我的问题的解决方案如下:

#after login and submit_form do this:
download <- jump_to(main_page, download_url)

# write file to current working directory
writeBin(download$response$content, basename(download_url))
#登录并提交表单后执行以下操作:
下载