Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/silverlight/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何验证数千个PDF文件中的文本/内容_Java_Pdfbox - Fatal编程技术网

Java 如何验证数千个PDF文件中的文本/内容

Java 如何验证数千个PDF文件中的文本/内容,java,pdfbox,Java,Pdfbox,我想自动验证/断言每个PDF文件中的特定文本或句子集。我有1000个PDF文件,需要验证其中是否存在特定的文本/句子。您可以使用ApacheLucene和ApachePDFBox进行验证。 请参阅本文:使用PDFBox或Apache TIKA(使用PDFBox)的文本提取。

我想自动验证/断言每个PDF文件中的特定文本或句子集。我有1000个PDF文件,需要验证其中是否存在特定的文本/句子。

您可以使用ApacheLucene和ApachePDFBox进行验证。
请参阅本文:

使用PDFBox或Apache TIKA(使用PDFBox)的文本提取。