Adobe 从pdf获取excel文件

Adobe 从pdf获取excel文件,adobe,ocr,pdf-java-toolkit,Adobe,Ocr,Pdf Java Toolkit,我收到一份电脑填好的表格,打印出来后扫描成PDF格式的文件 我想将PDF转换成某种结构化格式(就像Acrobat在Excel中所做的那样),以便提取数据。我曾使用AdobeAcrobatPro DC软件尝试过这一点,该软件运行平稳,给了我理想的效果。问题是我想用Java实现同样的功能 我阅读了以上两个讨论,发现第一个线程在java中不可能实现,第二个线程说Datalogics PDF java Toolkit不包含导出函数 我创建了试用帐户并导航到“” 我在订阅服务时遇到此错误 有人可以把

我收到一份电脑填好的表格,打印出来后扫描成PDF格式的文件

我想将PDF转换成某种结构化格式(就像Acrobat在Excel中所做的那样),以便提取数据。我曾使用AdobeAcrobatPro DC软件尝试过这一点,该软件运行平稳,给了我理想的效果。问题是我想用Java实现同样的功能

我阅读了以上两个讨论,发现第一个线程在java中不可能实现,第二个线程说Datalogics PDF java Toolkit不包含导出函数

我创建了试用帐户并导航到“” 我在订阅服务时遇到此错误

有人可以把我路由到ReST端点,这样我就可以使用JavaScript本身进行转换,因为我找不到它


也欢迎其他选择,但约束条件是,从扫描的PDF中提取的数据应该与Acrobat作为输出提供的数据类似(以某种方式结构化),因为稍后我会存储这些信息以用于其他服务。

虽然Datalogics PDF Java Toolkit不会直接导出到Excel,您可以使用Datalogics PDF Java Toolkit从PDF表单字段中获取信息,并将其放入可以在Excel中打开的CSV文件中。请参阅,虽然Datalogics PDF Java Toolkit不会直接导出到Excel,但您可以使用Datalogics PDF Java Toolkit从PDF表单字段中获取信息,并将其导入可以在Excel中打开的CSV文件中。看见