用java:apachefo将表的不同维度的PDF转换为XML

用java:apachefo将表的不同维度的PDF转换为XML,java,Java,我有一个pdf文件,我需要使用Java将其转换为XML文件。在我的pdf文件中,有不同维度的不同表格。请建议方法 请注意,输入pdf文件是使用Apache FO从xml生成的,现在我需要再次转换回xml。您能解释一下为什么要这样做吗?这在理论上可能是可行的,但几乎不实际。不过,理论上的方法是将PDF解析为对象模型,并为该模型实现XML格式化程序。如果您的PDF是使用Apache FOP生成的,那么简单地保留/重新使用相应的XML和XSLT文件如何?我的项目中有一个要求。我得到了一个使用Apach

我有一个pdf文件,我需要使用Java将其转换为XML文件。在我的pdf文件中,有不同维度的不同表格。请建议方法


请注意,输入pdf文件是使用Apache FO从xml生成的,现在我需要再次转换回xml。

您能解释一下为什么要这样做吗?这在理论上可能是可行的,但几乎不实际。不过,理论上的方法是将PDF解析为对象模型,并为该模型实现XML格式化程序。如果您的PDF是使用Apache FOP生成的,那么简单地保留/重新使用相应的XML和XSLT文件如何?我的项目中有一个要求。我得到了一个使用Apache FOP生成的PDF文件,现在我需要从pdf格式的表中读取参数值,我需要再次将其转换为xml。请帮助我使用示例方法。我仍然认为您的做法是错误的,但是如果您仍然决心解析pdf文件,请查看。RUPS包括一个PDF对象模型查看器,这意味着支持首先将PDF解析为对象模型。此外,它可能还能够解析PDF文件(我自己从未使用过)。