Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/70.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 下载文件重定向错误_R_Pdf_Curl_Httr - Fatal编程技术网

R 下载文件重定向错误

R 下载文件重定向错误,r,pdf,curl,httr,R,Pdf,Curl,Httr,您好,我正在尝试使用R通过ProPublica非营利资源管理器API下载pdf文件: 当我查询API时,它返回指向PDF的链接。但是,这些链接重定向到AWS,例如 我已尝试按照本讨论中的建议指定method=“curl”,extra='-L':。这将返回状态127 我也尝试过使用CRAN的“Downloader”软件包。这会下载一个文件,但它似乎在某种程度上被破坏了,因为当我试图打开它时,Adobe会说“内存不足” 有人有什么建议吗 只需使用httr(您也应该将其用于API访问)写入磁盘()是您

您好,我正在尝试使用R通过ProPublica非营利资源管理器API下载pdf文件:

当我查询API时,它返回指向PDF的链接。但是,这些链接重定向到AWS,例如

我已尝试按照本讨论中的建议指定
method=“curl”,extra='-L'
:。这将返回状态127

我也尝试过使用CRAN的“Downloader”软件包。这会下载一个文件,但它似乎在某种程度上被破坏了,因为当我试图打开它时,Adobe会说“内存不足”


有人有什么建议吗

只需使用
httr
(您也应该将其用于API访问)<代码>写入磁盘()是您的bff:

library(httr)

pp_doc_url <- "https://projects.propublica.org/nonprofits/download-filing?path=2015_06_T%2F13-1624100_990T_201406.pdf"

GET(
  url = pp_doc_url,
  write_disk("file.pdf"),
  verbose()
) -> res

在“生产”中停止使用
verbose()<代码>写入磁盘()
是您的bff:

library(httr)

pp_doc_url <- "https://projects.propublica.org/nonprofits/download-filing?path=2015_06_T%2F13-1624100_990T_201406.pdf"

GET(
  url = pp_doc_url,
  write_disk("file.pdf"),
  verbose()
) -> res
在“生产”中取消
verbose()

res
## Response [https://pp-990.s3.amazonaws.com/2015_06_T/13-1624100_990T_201406.pdf?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAI7C6X5GT42DHYZIA%2F20171202%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20171202T002756Z&X-Amz-Expires=1800&X-Amz-SignedHeaders=host&X-Amz-Signature=f90caae6a793239be8342d0ecbd96ff6f80b1821921cfadae00f78129a38a79f]
##   Date: 2017-12-02 00:27
##   Status: 200
##   Content-Type: application/pdf
##   Size: 538 kB
## <ON DISK>  file.pdf
file.info("file.pdf")
##            size isdir mode               mtime               ctime               atime uid gid    uname grname
## file.pdf 537542 FALSE  644 2017-12-01 19:27:57 2017-12-01 19:27:57 2017-12-01 19:27:58 xxx  xx xxxxxxxx  xxxxx