使用php解析pdf

使用php解析pdf,php,parsing,pdf,Php,Parsing,Pdf,我知道这个问题已经被问过好几次了。我检查了所有人,但没有一个人给出满意的答案 有人说TCPDF可以解析,但我在它的网站上搜索过。没有提供任何内容来阅读pdf。 xpdf是一个安装在服务器上的实用程序,然后运行命令来提取文本 我甚至搜索了FPDF,但在该网站上也没有给出任何关于阅读pdf或任何与readin手册相关的功能的信息 那么我必须使用pdfbox和java桥来提取文本吗。。?或者是一些人可以回答说使用tcpdf是可能的 现在我更喜欢什么…?我认为状态基本上与过去一样:没有PDF解析器的PH

我知道这个问题已经被问过好几次了。我检查了所有人,但没有一个人给出满意的答案

有人说TCPDF可以解析,但我在它的网站上搜索过。没有提供任何内容来阅读pdf。 xpdf是一个安装在服务器上的实用程序,然后运行命令来提取文本

我甚至搜索了FPDF,但在该网站上也没有给出任何关于阅读pdf或任何与readin手册相关的功能的信息

那么我必须使用pdfbox和java桥来提取文本吗。。?或者是一些人可以回答说使用tcpdf是可能的


现在我更喜欢什么…?

我认为状态基本上与过去一样:没有PDF解析器的PHP本机实现。有,我知道也有其他语言的实现(我个人使用Python库),但没有原生PHP。

PDF基本上就是Postscript代码。除非文本嵌入到图像中,否则您应该能够查看原始postscript代码,并使用基本文件i/o和字符串操作提取文本。