Itext pdf操作-标记图像或图形

Itext pdf操作-标记图像或图形,itext,pdfbox,tagging,programmatically,pdf-manipulation,Itext,Pdfbox,Tagging,Programmatically,Pdf Manipulation,我有一个源pdf(untaged.pdf),我将从中创建一个带标签的版本(taged.pdf) 我有源pdf所有内容的所有html标记的信息 现在我在第三页有一个数字。当我以编程方式解析时,它不会被检测为图像,但这是一个包含一些文本的矩形和另一个矩形,如下所示 _____________________ ____________________ | Some text inside | ----> | Some other text | |

我有一个源pdf(untaged.pdf),我将从中创建一个带标签的版本(taged.pdf)

我有源pdf所有内容的所有html标记的信息

现在我在第三页有一个数字。当我以编程方式解析时,它不会被检测为图像,但这是一个包含一些文本的矩形和另一个矩形,如下所示

    _____________________         ____________________
   |    Some text inside | ----> |   Some other text  |
   |                     | ----> |            Inside  |
   |_____________________| ----> |____________________|

             Fig 1.x Rectangle 1 to Rectangle 2
使用其他一些技术,我发现这是一个数字和边界坐标相同。假设边界坐标是[10,30]和[100,60],我想将整个东西标记为一个图形(如下所示)

现在我想将整个部分标记为图像。我查过像itextpdf或pdfbox这样的库。他们没有API来使用坐标标记图形


换句话说,是否有任何方法可以通过编程方式将元素(图像组)标记为图形。

是否检查了是否可以使用类似于from iText的方法来识别图像部分?您可以在线试用,无需任何代码。否则,我建议你发布你正在处理的PDF文件,以便有人可以查看。我已经在PDF中识别了图像边界框。我必须将它们标记为图像。您是否可以提供一个示例PDF,以便我可以看到您试图实现的目标/标记?如果您熟悉PDF结构,您还可以检查PDF的结构,然后使用上所述的类似方法。感谢您的回复,这与特定的PDF或图像无关。我正在尝试构建一个通用的解决方案,其中我想使用元素的坐标来标记元素。您是否检查过是否可以使用类似于from iText的东西来识别图像部分?您可以在线试用,无需任何代码。否则,我建议你发布你正在处理的PDF文件,以便有人可以查看。我已经在PDF中识别了图像边界框。我必须将它们标记为图像。您是否可以提供一个示例PDF,以便我可以看到您试图实现的目标/标记?如果您熟悉PDF结构,您还可以检查PDF的结构,然后使用上所述的类似方法。感谢您的回复,这与特定的PDF或图像无关。我正在尝试构建一个通用解决方案,其中我希望使用元素的坐标来标记元素。
   _____________________________________________________________(100, 60)
  |                                                             |
  |      _____________________         ____________________     |
  |     |    Some text inside | ----> |   Some other text  |    |
  |     |                     | ----> |            Inside  |    |
  |     |_____________________| ----> |____________________|    |
  |                                                             |
  |           Fig 1.x Rectangle 1 to Rectangle 2                |
  |_____________________________________________________________|
  (10, 30)