使用Pdfbox在java中解析PDF表

使用Pdfbox在java中解析PDF表,java,parsing,pdf,pdfbox,Java,Parsing,Pdf,Pdfbox,我已经找了很长时间的答案,但我什么也没找到。 我的问题是在解析pdf时,我用一些表格制作了一个页面。 我已经编写了一些代码,通过这些代码我可以从指定的矩形中提取表单,但我在代码中声明了这些值,它并不像应该的那样是动态的。我想找到有关单元格的信息,有了这些信息,我就能得到我需要的字符串。在PDFBoxAPI中,我没有找到任何有用的东西。 对于任何提示,我都会很优雅。解析具有某种光学意义但在二进制数据中没有任何表示意义的结构的页面通常都很困难,而且很难实现。一旦你有了一些信息,使结构的识别更容易,它

我已经找了很长时间的答案,但我什么也没找到。 我的问题是在解析pdf时,我用一些表格制作了一个页面。 我已经编写了一些代码,通过这些代码我可以从指定的矩形中提取表单,但我在代码中声明了这些值,它并不像应该的那样是动态的。我想找到有关单元格的信息,有了这些信息,我就能得到我需要的字符串。在PDFBoxAPI中,我没有找到任何有用的东西。
对于任何提示,我都会很优雅。

解析具有某种光学意义但在二进制数据中没有任何表示意义的结构的页面通常都很困难,而且很难实现。一旦你有了一些信息,使结构的识别更容易,它可能更可行。事实上,我正在考虑是否有可能获得打印在我的文件中的线条的坐标。之后,我可以提取它们之间的字符串。也许有人知道如何从这样的文件中获取文本吗?可能是重复的