Php PDF解析特定文本

Php PDF解析特定文本,php,parsing,pdf,Php,Parsing,Pdf,大家好,我正在开发一个可以解析pdf数据的应用程序,以便在移动设备上查看。我正在寻找一种方法,通过pdf文件扫描特定文本,并获取文本块的x&y坐标。这可能吗。我使用php在Linux服务器上工作,但我可以灵活地使用任何方法来实现这一点。谢谢。商业选项: TET(文本提取工具包)SDK来自;Acrobat插件可用于测试该机制 PDFToolboxSDK来自;可用于测试的交互式桌面版本 如果您已经准备好自己编写更多的代码:AdobePDF库,SDK,可通过Datalogics获得 所有这些都非常

大家好,我正在开发一个可以解析pdf数据的应用程序,以便在移动设备上查看。我正在寻找一种方法,通过pdf文件扫描特定文本,并获取文本块的x&y坐标。这可能吗。我使用php在Linux服务器上工作,但我可以灵活地使用任何方法来实现这一点。谢谢。

商业选项:

  • TET(文本提取工具包)SDK来自;Acrobat插件可用于测试该机制
  • PDFToolboxSDK来自;可用于测试的交互式桌面版本
  • 如果您已经准备好自己编写更多的代码:AdobePDF库,SDK,可通过Datalogics获得
所有这些都非常成熟,TET非常专用于文本提取,pdfToolbox是一个用于分析和操作PDF的通用SDK(但有一个特定的功能来进行文本提取,页面上有文本坐标),Adobe PDF Library是一个通用开发工具(提供了许多低级功能,但必须编写代码来查找文本/单词/字符并提取坐标)

免责声明:我为callas软件工作,我对pdfToolbox的看法可能有偏见