Java 根据iText中的大小或颜色从PDF中提取文本

Java 根据iText中的大小或颜色从PDF中提取文本,java,pdf,itext,pdf-parsing,Java,Pdf,Itext,Pdf Parsing,我有一些类似布局的PDF文件 例如,它们的介绍部分具有相同的字体颜色和大小 我想使用此文本属性信息从这些PDF文件中提取介绍部分,但我找不到任何方法 例如,我将给出一个类似#333333的参数,它只返回PDF中的#333333颜色的文本。可能吗 我使用iText库 谢谢..我认为iText不是完成此任务的合适工具。iText对页面内容解析的支持非常有限。你能推荐你知道的其他工具吗?也许我可以更改我的库,因为我将进行内容解析。我用Apache的PDFBOX更改了我的库。我也无法在pdfbox中找到

我有一些类似布局的PDF文件

例如,它们的介绍部分具有相同的字体颜色和大小

我想使用此文本属性信息从这些PDF文件中提取介绍部分,但我找不到任何方法

例如,我将给出一个类似#333333的参数,它只返回PDF中的#333333颜色的文本。可能吗

我使用iText库


谢谢..

我认为iText不是完成此任务的合适工具。iText对页面内容解析的支持非常有限。你能推荐你知道的其他工具吗?也许我可以更改我的库,因为我将进行内容解析。我用Apache的PDFBOX更改了我的库。我也无法在pdfbox中找到问题的解决方案,但它根据iText更清晰地解析文本内容。我认为iText不是完成此任务的合适工具。iText对页面内容解析的支持非常有限。你能推荐你知道的其他工具吗?也许我可以更改我的库,因为我将进行内容解析。我用Apache的PDFBOX更改了我的库。我也无法在pdfbox中找到问题的解决方案,但它根据iText更清晰地解析文本内容。