在R中阅读PDF文件包_R_Pdf_Pdftools

在R中阅读PDF文件包

r pdf

在R中阅读PDF文件包,r,pdf,pdftools,R,Pdf,Pdftools,是否可以在R中读取/转换PDF公文包我通常使用pdftools，但是，我得到一个错误：库（pdftools） #>使用poppler版本0.73.0 链接转换页面1到K190072_1.png。。。 #>PDF错误：不一致的码流TPsot==TNsot。 #>PDF错误：不一致的码流TPsot==TNsot。 #>PDF错误：不一致的码流TPsot==TNsot。 #>PDF错误：不一致的码流TPsot==TNsot。 #>完成了！ #>[1]“K190072_1.png” 由（v1.0.

是否可以在R中读取/转换PDF公文包

我通常使用

pdftools

，但是，我得到一个错误：

库（pdftools）
#>使用poppler版本0.73.0
链接转换页面1到K190072_1.png。。。
#>PDF错误：不一致的码流TPsot==TNsot。
#>PDF错误：不一致的码流TPsot==TNsot。
#>PDF错误：不一致的码流TPsot==TNsot。
#>PDF错误：不一致的码流TPsot==TNsot。
#>完成了！
#>[1]“K190072_1.png”

由（v1.0.0）于2021-05-06创建

我最终得到的

k19072_1.png

只是公文包首页的图像

我对本pdf文件集的文件

K190072.510k摘要.Final\u Sent001.pdf

感兴趣

我为Python（）找到了一种方法，但我真的很想在R中这样做

感谢您的帮助。

处理一页原始pdf数据时，

pdf\u convert

似乎存在问题（在这些情况下，它希望使用

basename（pdf）

），因此我已编辑了该函数，以便它也可以处理第二个附加的pdf文件

如果您只需要第一个文件，则可以使用原始的

pdf\u convert

函数运行此功能，但第二个文件会出现错误

如果您对从附加文件渲染光栅图形感兴趣，这对我很有用：

库（pdftools）
#>使用poppler版本21.02.0
链接[[1]]
#>[1]“K190072.510K摘要。最终文件001-1.png”
#>[2]“K190072.510K摘要。最终文件001-2.png”
#>[3]“K190072.510K摘要。最终文件001-3.png”
#>[4]“K190072.510K摘要。最终文件001-4.png”
#>[5]“K190072.510K摘要。最终文件001-5.png”
#> 
#> [[2]]
#>[1]“K190072.IFU.FINAL_Sent001-1.png”
#> 
#> [[3]]
#>[1]“K190072.Letter.SE.FINAL_Sent001-1.png”
#>[2]“K190072.Letter.SE.FINAL_Sent001-2.png”

由（v2.0.0）于2021-05-05创建