使用php从pdf文件读取数据

使用php从pdf文件读取数据,php,pdf,Php,Pdf,我使用此链接中的代码阅读pdf文件。我的pdf文件包含一个表结构,但在阅读该文件后,所有数据混乱,如xxx 333从2014年1月26日国家/地区退出yyy 444进入2014年1月26日国家/地区zzz 555从2014年1月26日国家/地区退出 我的pdf结构是 visaNo名称日期类型 333 xxx 26-01-2014来自国家/地区 444 2014年1月26日yyy进入国家/地区 555 zzz 26-01-2014存在于国家恐怕没有简单的解决方法。 在pdf源代码中,您写下文本位的

我使用此链接中的代码阅读pdf文件。我的pdf文件包含一个表结构,但在阅读该文件后,所有数据混乱,如xxx 333从2014年1月26日国家/地区退出yyy 444进入2014年1月26日国家/地区zzz 555从2014年1月26日国家/地区退出

我的pdf结构是

visaNo名称日期类型

333 xxx 26-01-2014来自国家/地区
444 2014年1月26日yyy进入国家/地区

555 zzz 26-01-2014存在于国家

恐怕没有简单的解决方法。 在pdf源代码中,您写下文本位的顺序并不重要,因为您可以为它们指定特定的坐标。 你可以做的两件事是(imho):

  • [在任何情况下]更改您的代码,以提供分开的文本流(可能用您选择的特殊字符替换Tj和Tj,而不是将它们丢弃)
  • 如果您非常确定生成pdf文件的软件动作一致,请手动切换列(单元格将由您的特殊字符分隔)
  • 如果没有,我担心您将不得不进一步更改代码,并处理所有文本流的坐标,并从中猜测文本流的行和列
  • 我真的希望你有一些php类这样做