在R中阅读PDF文件包

在R中阅读PDF文件包,r,pdf,pdftools,R,Pdf,Pdftools,是否可以在R中读取/转换PDF公文包 我通常使用pdftools,但是,我得到一个错误: 库(pdftools) #>使用poppler版本0.73.0 链接转换页面1到K190072_1.png。。。 #>PDF错误:不一致的码流TPsot==TNsot。 #>PDF错误:不一致的码流TPsot==TNsot。 #>PDF错误:不一致的码流TPsot==TNsot。 #>PDF错误:不一致的码流TPsot==TNsot。 #>完成了! #>[1]“K190072_1.png” 由(v1.0.

是否可以在R中读取/转换PDF公文包

我通常使用
pdftools
,但是,我得到一个错误:

库(pdftools)
#>使用poppler版本0.73.0
链接转换页面1到K190072_1.png。。。
#>PDF错误:不一致的码流TPsot==TNsot。
#>PDF错误:不一致的码流TPsot==TNsot。
#>PDF错误:不一致的码流TPsot==TNsot。
#>PDF错误:不一致的码流TPsot==TNsot。
#>完成了!
#>[1]“K190072_1.png”
由(v1.0.0)于2021-05-06创建

我最终得到的
k19072_1.png
只是公文包首页的图像

我对本pdf文件集的文件
K190072.510k摘要.Final\u Sent001.pdf
感兴趣

我为Python()找到了一种方法,但我真的很想在R中这样做


感谢您的帮助。

处理一页原始pdf数据时,
pdf\u convert
似乎存在问题(在这些情况下,它希望使用
basename(pdf)
),因此我已编辑了该函数,以便它也可以处理第二个附加的pdf文件

如果您只需要第一个文件,则可以使用原始的
pdf\u convert
函数运行此功能,但第二个文件会出现错误

如果您对从附加文件渲染光栅图形感兴趣,这对我很有用:

库(pdftools)
#>使用poppler版本21.02.0
链接[[1]]
#>[1]“K190072.510K摘要。最终文件001-1.png”
#>[2]“K190072.510K摘要。最终文件001-2.png”
#>[3]“K190072.510K摘要。最终文件001-3.png”
#>[4]“K190072.510K摘要。最终文件001-4.png”
#>[5]“K190072.510K摘要。最终文件001-5.png”
#> 
#> [[2]]
#>[1]“K190072.IFU.FINAL_Sent001-1.png”
#> 
#> [[3]]
#>[1]“K190072.Letter.SE.FINAL_Sent001-1.png”
#>[2]“K190072.Letter.SE.FINAL_Sent001-2.png”
由(v2.0.0)于2021-05-05创建