使用PHP从mysql中存储的PDF中读取文本

使用PHP从mysql中存储的PDF中读取文本,php,mysql,pdf,text,Php,Mysql,Pdf,Text,我试图使用PHP从存储在mysql数据库中的PDF文件中读取文本。我尝试使用class.pdf2text.php,它可以处理实际的文件。我尝试使用MYSQL_RESULT变量处理该类的pdf文件内容,但它不起作用。我肯定错过了一些很容易的事情,我知道 基本上,这就是我要做的: 我有一个带有PDF文件的数据库。我需要将该数据库中的PDF转换为文本,然后在该文本上搜索特定数据。有没有一种方法可以在不使用PHP创建外部文件的情况下做到这一点?我认为最接近您的方法是用户临时文件-但我认为您仍然需要使用文

我试图使用PHP从存储在mysql数据库中的PDF文件中读取文本。我尝试使用class.pdf2text.php,它可以处理实际的文件。我尝试使用MYSQL_RESULT变量处理该类的pdf文件内容,但它不起作用。我肯定错过了一些很容易的事情,我知道

基本上,这就是我要做的:
我有一个带有PDF文件的数据库。我需要将该数据库中的PDF转换为文本,然后在该文本上搜索特定数据。有没有一种方法可以在不使用PHP创建外部文件的情况下做到这一点?

我认为最接近您的方法是用户临时文件-但我认为您仍然需要使用文件,因为最有可能的是
class.pdf2text.PHP
正在使用poppler/xpdf/ghostscript读取pdf中的文本,并且它们需要对files.class.pdf2text.PHP执行操作实际上,这对我来说是行不通的,因为这些文件看起来比它能处理的更复杂。pdftotext在这些文件上工作得很好。但我遇到的问题是,我在变量中包含文件内容,但我无法将其传递给pdftotext的exec命令,因为它需要的是实际的文件,而不是文件内容。有什么建议吗?如果变量中包含二进制PDF内容,请使用
file\u put\u contents()
将文件内容写入临时文件,然后可以在临时文件上运行
pdftotext
。确保在完成时取消临时文件的链接()。是的,这会起作用,但我不想使用临时文件。如果没有别的办法,我就走这条路。谢谢你的建议。