Java 如何在pdf中搜索特定内容(带或不带正则表达式)?
我有一个PDF文件列表。我想搜索每个文件中是否存在特定内容,并将包含该内容的文件与其他文件分开。我想知道使用Java library iText是否可以实现这种搜索功能。您的问题的答案是肯定的,这可能是可能的,但这取决于PDF的性质。你应该更具体一些,因为如果你的文件是由扫描过的图像组成的话,1是不可能的,如果字体不允许提取文本,2是不可能的。如果你的下一个问题是我如何做到这一点,那么你应该首先展示你的尝试。例如:您是否尝试过?特定内容-请同时指定特定内容的性质。它只是一行字的序列吗?这是图像吗?是背景色吗?Java 如何在pdf中搜索特定内容(带或不带正则表达式)?,java,itext,Java,Itext,我有一个PDF文件列表。我想搜索每个文件中是否存在特定内容,并将包含该内容的文件与其他文件分开。我想知道使用Java library iText是否可以实现这种搜索功能。您的问题的答案是肯定的,这可能是可能的,但这取决于PDF的性质。你应该更具体一些,因为如果你的文件是由扫描过的图像组成的话,1是不可能的,如果字体不允许提取文本,2是不可能的。如果你的下一个问题是我如何做到这一点,那么你应该首先展示你的尝试。例如:您是否尝试过?特定内容-请同时指定特定内容的性质。它只是一行字的序列吗?这是图像吗