使用R下载pdf会生成损坏的文件

使用R下载pdf会生成损坏的文件,r,pdf,R,Pdf,我想使用R从该网站下载pdf文件。该文件正在下载,但我无法打开,因为它说pdf已损坏。这是我的密码: url <- "https://www.bchousing.org/research-centre/housing-data/new-homes-data" download.file(url, 'New Homes Registry Report - June 2020.pdf', mode="wb") url该链接指向HTML页面,而不是pdf

我想使用R从该网站下载pdf文件。该文件正在下载,但我无法打开,因为它说pdf已损坏。这是我的密码:

url <- "https://www.bchousing.org/research-centre/housing-data/new-homes-data"
download.file(url, 'New Homes Registry Report - June 2020.pdf', mode="wb")

url该链接指向HTML页面,而不是pdf文件。也许你应该尝试使用该软件包从内容中删除文件名?你知道我如何修复代码吗?尝试下载pdf格式的文件,如
https://www.bchousing.org/publication/New-Homes-Registry-Report-January-2020.pdf
。我想你这次只需要这些数据,然后,在R之外下载并找出之后如何处理这些文件会快得多。但是,如果您需要自动执行此过程,那么在本例中,使用
rvest
进行刮片很可能会做得很好。如果这不起作用,还有其他方法,但没有一种比
rvest
更简单。是的,我想自动化这个过程的原因是,我必须每月从表3中提取最新数据。我曾经手动打开最新的pdf并读取表3中的数字,但我认为这一过程可以使用R实现自动化。我正在考虑使用R执行以下步骤:1-下载最新的每月pdf文件2-从表3中提取数据3-获取最新的数字(例如,2020年6月)。我现在陷入了第一步。