在R中阅读PDF文件包
是否可以在R中读取/转换PDF公文包 我通常使用在R中阅读PDF文件包,r,pdf,pdftools,R,Pdf,Pdftools,是否可以在R中读取/转换PDF公文包 我通常使用pdftools,但是,我得到一个错误: 库(pdftools) #>使用poppler版本0.73.0 链接转换页面1到K190072_1.png。。。 #>PDF错误:不一致的码流TPsot==TNsot。 #>PDF错误:不一致的码流TPsot==TNsot。 #>PDF错误:不一致的码流TPsot==TNsot。 #>PDF错误:不一致的码流TPsot==TNsot。 #>完成了! #>[1]“K190072_1.png” 由(v1.0.
pdftools
,但是,我得到一个错误:
库(pdftools)
#>使用poppler版本0.73.0
链接转换页面1到K190072_1.png。。。
#>PDF错误:不一致的码流TPsot==TNsot。
#>PDF错误:不一致的码流TPsot==TNsot。
#>PDF错误:不一致的码流TPsot==TNsot。
#>PDF错误:不一致的码流TPsot==TNsot。
#>完成了!
#>[1]“K190072_1.png”
由(v1.0.0)于2021-05-06创建
我最终得到的k19072_1.png
只是公文包首页的图像
我对本pdf文件集的文件K190072.510k摘要.Final\u Sent001.pdf
感兴趣
我为Python()找到了一种方法,但我真的很想在R中这样做
感谢您的帮助。处理一页原始pdf数据时,
pdf\u convert
似乎存在问题(在这些情况下,它希望使用basename(pdf)
),因此我已编辑了该函数,以便它也可以处理第二个附加的pdf文件
如果您只需要第一个文件,则可以使用原始的pdf\u convert
函数运行此功能,但第二个文件会出现错误
如果您对从附加文件渲染光栅图形感兴趣,这对我很有用:
库(pdftools)
#>使用poppler版本21.02.0
链接[[1]]
#>[1]“K190072.510K摘要。最终文件001-1.png”
#>[2]“K190072.510K摘要。最终文件001-2.png”
#>[3]“K190072.510K摘要。最终文件001-3.png”
#>[4]“K190072.510K摘要。最终文件001-4.png”
#>[5]“K190072.510K摘要。最终文件001-5.png”
#>
#> [[2]]
#>[1]“K190072.IFU.FINAL_Sent001-1.png”
#>
#> [[3]]
#>[1]“K190072.Letter.SE.FINAL_Sent001-1.png”
#>[2]“K190072.Letter.SE.FINAL_Sent001-2.png”
由(v2.0.0)于2021-05-05创建