Java 提取图像PDF Apache Tika 1.15命令行
我试图使用ApacheTika命令行工具从pdf中提取图像 我有一个python服务器,我不想仅仅为了使用Tika而用Java重建它。我的解决方案是使用命令行工具从pdf中提取图像,然后从python中读取。问题是,当我将Java 提取图像PDF Apache Tika 1.15命令行,java,python,shell,pdf,apache-tika,Java,Python,Shell,Pdf,Apache Tika,我试图使用ApacheTika命令行工具从pdf中提取图像 我有一个python服务器,我不想仅仅为了使用Tika而用Java重建它。我的解决方案是使用命令行工具从pdf中提取图像,然后从python中读取。问题是,当我将--extract或-z命令发送到命令行工具时,它不会从pdf中提取图像 我知道可以从这个pdf中提取图像,因为我以前使用的是pdfimages,它正确地提取了这些图像 有人能帮我解决这个问题吗 以色列你能等几天吗?Tika 1.16是标准的先生,我使用的是ApacheTika
--extract
或-z
命令发送到命令行工具时,它不会从pdf中提取图像
我知道可以从这个pdf中提取图像,因为我以前使用的是pdfimages
,它正确地提取了这些图像
有人能帮我解决这个问题吗
以色列你能等几天吗?Tika 1.16是标准的先生,我使用的是ApacheTika服务器1.16JAR,我仍然无法从pdf中提取图像。有什么方法可以启用它吗?如果你使用Tika应用程序,那么它是标准的。在Tika服务器中,您需要在请求中传递一个自定义HTTP头来启用
pdfParserConfig.setExtractInlineImages