如何搜索PDF 1.7文件中的文本(从带有gui的工具,或者更好的是从命令行.bat或.sh文件)?

如何搜索PDF 1.7文件中的文本(从带有gui的工具,或者更好的是从命令行.bat或.sh文件)?,pdf,adobe,livecycle,text-search,Pdf,Adobe,Livecycle,Text Search,我需要在大量pdf文件中搜索文本 这些文件是“普通”PDF文件,其他文件是使用Adobe Livecycle生成的,是“PDF 1.7”文件 在普通文件上,我可以使用例如PDF XChange Viewer(rif.)或RECOL(rif.)搜索文本,但它们不适用于“PDF 1.7”文件 是否有一些解决方案适用于这两种类型的PDF文件 有什么建议吗?事先非常感谢 Cesare您在哪里看到它们是“PDF 1.7”文件?1.7只是PDF标准的最新版本,不应导致任何异常行为。使用Livecycle创建

我需要在大量pdf文件中搜索文本

这些文件是“普通”PDF文件,其他文件是使用Adobe Livecycle生成的,是“PDF 1.7”文件

在普通文件上,我可以使用例如PDF XChange Viewer(rif.)或RECOL(rif.)搜索文本,但它们不适用于“PDF 1.7”文件

是否有一些解决方案适用于这两种类型的PDF文件

有什么建议吗?事先非常感谢


Cesare

您在哪里看到它们是“PDF 1.7”文件?1.7只是PDF标准的最新版本,不应导致任何异常行为。使用Livecycle创建的文件(Livecycle WHAT?Designer、表单服务器、文档服务器?)可以是XFA文件,其周围有PDF包装,以便适合在Acrobat/Reader中显示。PDF版本1.7是允许该功能的版本。但是,它需要XFA引擎正确显示文件。由于XFA是XML的一种变体,您可能可以搜索XML部分。您在哪里看到“PDF 1.7”文件?1.7只是PDF标准的最新版本,不应导致任何异常行为。使用Livecycle创建的文件(Livecycle WHAT?Designer、表单服务器、文档服务器?)可以是XFA文件,其周围有PDF包装,以便适合在Acrobat/Reader中显示。PDF版本1.7是允许该功能的版本。但是,它需要XFA引擎正确显示文件。由于XFA是XML的一种变体,因此您可以搜索XML部分。