Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/381.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 使用pdfbox提取pdf格式的表格数据_Java_Scala_Pdfbox - Fatal编程技术网

Java 使用pdfbox提取pdf格式的表格数据

Java 使用pdfbox提取pdf格式的表格数据,java,scala,pdfbox,Java,Scala,Pdfbox,我们可以使用PDFBOXAPI提取pdf格式的表格数据吗。使用PDFTextStripper中的getText会删除列到数据映射之类的信息,因为每个单元格中的数据之间缺少分隔符。您能推荐一种方法吗?“使用PDFTextStripper中的getText是删除列到数据映射之类的信息”——除非您谈论的是带标签的PDF,否则PDF中没有什么比列到数据映射更好的了。PDF中通常只有坐标处的文本getText删除坐标,但您可以覆盖PDFTextStripper的方法来检索带坐标的文本。关于堆栈溢出,这里有

我们可以使用PDFBOXAPI提取pdf格式的表格数据吗。使用PDFTextStripper中的getText会删除列到数据映射之类的信息,因为每个单元格中的数据之间缺少分隔符。您能推荐一种方法吗?

“使用PDFTextStripper中的getText是删除列到数据映射之类的信息”——除非您谈论的是带标签的PDF,否则PDF中没有什么比列到数据映射更好的了。PDF中通常只有坐标处的文本
getText
删除坐标,但您可以覆盖
PDFTextStripper
的方法来检索带坐标的文本。关于堆栈溢出,这里有很多问题和答案。请尝试PDFBox顶部的表格。