Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/371.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何在pdf中搜索特定内容(带或不带正则表达式)?_Java_Itext - Fatal编程技术网

Java 如何在pdf中搜索特定内容(带或不带正则表达式)?

Java 如何在pdf中搜索特定内容(带或不带正则表达式)?,java,itext,Java,Itext,我有一个PDF文件列表。我想搜索每个文件中是否存在特定内容,并将包含该内容的文件与其他文件分开。我想知道使用Java library iText是否可以实现这种搜索功能。您的问题的答案是肯定的,这可能是可能的,但这取决于PDF的性质。你应该更具体一些,因为如果你的文件是由扫描过的图像组成的话,1是不可能的,如果字体不允许提取文本,2是不可能的。如果你的下一个问题是我如何做到这一点,那么你应该首先展示你的尝试。例如:您是否尝试过?特定内容-请同时指定特定内容的性质。它只是一行字的序列吗?这是图像吗

我有一个PDF文件列表。我想搜索每个文件中是否存在特定内容,并将包含该内容的文件与其他文件分开。我想知道使用Java library iText是否可以实现这种搜索功能。

您的问题的答案是肯定的,这可能是可能的,但这取决于PDF的性质。你应该更具体一些,因为如果你的文件是由扫描过的图像组成的话,1是不可能的,如果字体不允许提取文本,2是不可能的。如果你的下一个问题是我如何做到这一点,那么你应该首先展示你的尝试。例如:您是否尝试过?特定内容-请同时指定特定内容的性质。它只是一行字的序列吗?这是图像吗?是背景色吗?