Itext pdf操作-标记图像或图形_Itext_Pdfbox_Tagging_Programmatically_Pdf Manipulation

Itext pdf操作-标记图像或图形

itext

Itext pdf操作-标记图像或图形,itext,pdfbox,tagging,programmatically,pdf-manipulation,Itext,Pdfbox,Tagging,Programmatically,Pdf Manipulation,我有一个源pdf（untaged.pdf），我将从中创建一个带标签的版本（taged.pdf）我有源pdf所有内容的所有html标记的信息现在我在第三页有一个数字。当我以编程方式解析时，它不会被检测为图像，但这是一个包含一些文本的矩形和另一个矩形，如下所示 _____________________ ____________________ | Some text inside | ----> | Some other text | |

我有一个源pdf（untaged.pdf），我将从中创建一个带标签的版本（taged.pdf）

我有源pdf所有内容的所有html标记的信息

现在我在第三页有一个数字。当我以编程方式解析时，它不会被检测为图像，但这是一个包含一些文本的矩形和另一个矩形，如下所示

    _____________________         ____________________
   |    Some text inside | ----> |   Some other text  |
   |                     | ----> |            Inside  |
   |_____________________| ----> |____________________|

             Fig 1.x Rectangle 1 to Rectangle 2

使用其他一些技术，我发现这是一个数字和边界坐标相同。假设边界坐标是[10,30]和[100,60]，我想将整个东西标记为一个图形（如下所示）

现在我想将整个部分标记为图像。我查过像itextpdf或pdfbox这样的库。他们没有API来使用坐标标记图形

换句话说，是否有任何方法可以通过编程方式将元素（图像组）标记为图形。

是否检查了是否可以使用类似于from iText的方法来识别图像部分？您可以在线试用，无需任何代码。否则，我建议你发布你正在处理的PDF文件，以便有人可以查看。我已经在PDF中识别了图像边界框。我必须将它们标记为图像。您是否可以提供一个示例PDF，以便我可以看到您试图实现的目标/标记？如果您熟悉PDF结构，您还可以检查PDF的结构，然后使用上所述的类似方法。感谢您的回复，这与特定的PDF或图像无关。我正在尝试构建一个通用的解决方案，其中我想使用元素的坐标来标记元素。您是否检查过是否可以使用类似于from iText的东西来识别图像部分？您可以在线试用，无需任何代码。否则，我建议你发布你正在处理的PDF文件，以便有人可以查看。我已经在PDF中识别了图像边界框。我必须将它们标记为图像。您是否可以提供一个示例PDF，以便我可以看到您试图实现的目标/标记？如果您熟悉PDF结构，您还可以检查PDF的结构，然后使用上所述的类似方法。感谢您的回复，这与特定的PDF或图像无关。我正在尝试构建一个通用解决方案，其中我希望使用元素的坐标来标记元素。

   _____________________________________________________________(100, 60)
  |                                                             |
  |      _____________________         ____________________     |
  |     |    Some text inside | ----> |   Some other text  |    |
  |     |                     | ----> |            Inside  |    |
  |     |_____________________| ----> |____________________|    |
  |                                                             |
  |           Fig 1.x Rectangle 1 to Rectangle 2                |
  |_____________________________________________________________|
  (10, 30)