Java 如何验证数千个PDF文件中的文本/内容
我想自动验证/断言每个PDF文件中的特定文本或句子集。我有1000个PDF文件,需要验证其中是否存在特定的文本/句子。您可以使用ApacheLucene和ApachePDFBox进行验证。Java 如何验证数千个PDF文件中的文本/内容,java,pdfbox,Java,Pdfbox,我想自动验证/断言每个PDF文件中的特定文本或句子集。我有1000个PDF文件,需要验证其中是否存在特定的文本/句子。您可以使用ApacheLucene和ApachePDFBox进行验证。 请参阅本文:使用PDFBox或Apache TIKA(使用PDFBox)的文本提取。
请参阅本文:使用PDFBox或Apache TIKA(使用PDFBox)的文本提取。