使用R下载pdf会生成损坏的文件_R_Pdf

使用R下载pdf会生成损坏的文件

r pdf

使用R下载pdf会生成损坏的文件,r,pdf,R,Pdf,我想使用R从该网站下载pdf文件。该文件正在下载，但我无法打开，因为它说pdf已损坏。这是我的密码： url <- "https://www.bchousing.org/research-centre/housing-data/new-homes-data" download.file(url, 'New Homes Registry Report - June 2020.pdf', mode="wb") url该链接指向HTML页面，而不是pdf

我想使用R从该网站下载pdf文件。该文件正在下载，但我无法打开，因为它说pdf已损坏。这是我的密码：

url <- "https://www.bchousing.org/research-centre/housing-data/new-homes-data"
download.file(url, 'New Homes Registry Report - June 2020.pdf', mode="wb")

url该链接指向HTML页面，而不是pdf文件。也许你应该尝试使用该软件包从内容中删除文件名？你知道我如何修复代码吗？尝试下载pdf格式的文件，如https://www.bchousing.org/publication/New-Homes-Registry-Report-January-2020.pdf
。我想你这次只需要这些数据，然后，在R之外下载并找出之后如何处理这些文件会快得多。但是，如果您需要自动执行此过程，那么在本例中，使用rvest
进行刮片很可能会做得很好。如果这不起作用，还有其他方法，但没有一种比rvest
更简单。是的，我想自动化这个过程的原因是，我必须每月从表3中提取最新数据。我曾经手动打开最新的pdf并读取表3中的数字，但我认为这一过程可以使用R实现自动化。我正在考虑使用R执行以下步骤：1-下载最新的每月pdf文件2-从表3中提取数据3-获取最新的数字（例如，2020年6月）。我现在陷入了第一步。