Adobe 带有加密PDF的Apache Tika

Adobe 带有加密PDF的Apache Tika,adobe,apache-tika,Adobe,Apache Tika,我想使用ApacheTika库提取PDF内容。一切都很好,直到我遇到了加密用户名和密码的PDF。 它会出现如下错误: 信息文档是加密的 org.apache.tika.exception.EncryptedDocumentException:无法处理:文档已加密 位于org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:153) 原因:org.apache.pdfbox.exceptions.CryptographyException

我想使用ApacheTika库提取PDF内容。一切都很好,直到我遇到了加密用户名和密码的PDF。 它会出现如下错误:

信息文档是加密的 org.apache.tika.exception.EncryptedDocumentException:无法处理:文档已加密 位于org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:153)

原因:org.apache.pdfbox.exceptions.CryptographyException:找不到适用于Adobe.APS的安全处理程序 位于org.apache.pdfbox.pdmodel.PDDocument.decrypt(PDDocument.java:952) 位于org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:139) ... 4更多


有人知道Apache Tika是否支持使用此类安全功能提取PDF吗?

您可以在PDFBox用户列表中询问:users@pdfbox.apache.orgHey@fattysxx,您找到解决方案了吗,或者有任何更新吗?