Java 使用pdfbox提取pdf格式的表格数据
我们可以使用PDFBOXAPI提取pdf格式的表格数据吗。使用PDFTextStripper中的getText会删除列到数据映射之类的信息,因为每个单元格中的数据之间缺少分隔符。您能推荐一种方法吗?“使用PDFTextStripper中的getText是删除列到数据映射之类的信息”——除非您谈论的是带标签的PDF,否则PDF中没有什么比列到数据映射更好的了。PDF中通常只有坐标处的文本Java 使用pdfbox提取pdf格式的表格数据,java,scala,pdfbox,Java,Scala,Pdfbox,我们可以使用PDFBOXAPI提取pdf格式的表格数据吗。使用PDFTextStripper中的getText会删除列到数据映射之类的信息,因为每个单元格中的数据之间缺少分隔符。您能推荐一种方法吗?“使用PDFTextStripper中的getText是删除列到数据映射之类的信息”——除非您谈论的是带标签的PDF,否则PDF中没有什么比列到数据映射更好的了。PDF中通常只有坐标处的文本getText删除坐标,但您可以覆盖PDFTextStripper的方法来检索带坐标的文本。关于堆栈溢出,这里有
getText
删除坐标,但您可以覆盖PDFTextStripper
的方法来检索带坐标的文本。关于堆栈溢出,这里有很多问题和答案。请尝试PDFBox顶部的表格。