Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/387.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/sql-server/21.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 使用ApachePDFBox以正确的顺序从pdf中提取文本和图像_Java_Jakarta Ee_Pdfbox - Fatal编程技术网

Java 使用ApachePDFBox以正确的顺序从pdf中提取文本和图像

Java 使用ApachePDFBox以正确的顺序从pdf中提取文本和图像,java,jakarta-ee,pdfbox,Java,Jakarta Ee,Pdfbox,我正在尝试使用ApachePDFBox分析一个pdf文档。我已经设法分别提取文本和图像,但我想知道是否可以按各自的顺序提取这两种图像 我还没有浏览整个库,但我认为可以提取文本及其在文档中的位置。有没有办法使用此选项来知道在何处正确插入图像?您是否尝试了PrintTextLocations.java和PrintImageLocations.java示例?@Tilmahauser PrintImageLocations不适用于我的情况,它会为所有找到的图像打印0.0,0.0位置。您可以共享该PDF吗

我正在尝试使用ApachePDFBox分析一个
pdf
文档。我已经设法分别提取文本和图像,但我想知道是否可以按各自的顺序提取这两种图像


我还没有浏览整个库,但我认为可以提取文本及其在文档中的位置。有没有办法使用此选项来知道在何处正确插入图像?

您是否尝试了PrintTextLocations.java和PrintImageLocations.java示例?@Tilmahauser PrintImageLocations不适用于我的情况,它会为所有找到的图像打印0.0,0.0位置。您可以共享该PDF吗?另外,请确保您使用的是最新版本。@TilmanHausherr我使用的是
2.0.9中最新版本(
2.0.9
)中的类https://svn.apache.org/repos/asf/pdfbox/tags/2.0.9/examples/src/main/java/org/apache/pdfbox/examples/util/PrintImageLocations.java
。额外的信息是,这个类还可以打印图像的大小,这个很好用。最新版本是2.0.17。