Php 显示包含特定关键字的pdf文件

Php 显示包含特定关键字的pdf文件,php,file,pdf,search,full-text-search,Php,File,Pdf,Search,Full Text Search,我正在尝试开发一个搜索工具,搜索所有PDF中的单词,结果将列出所有包含单词或术语的PDF。我是一个完全的初学者,不知道它是怎么回事。我试着在互联网上搜索,得到了一个来源 上面的项目链接可以很好地处理txt、css和php文件,但不能处理pdf扩展名 任何想法或解决方案都是好的。提前感谢。您可以使用将pdf转换为文本,然后在文本中搜索您的单词。为了提高性能,我强烈建议您在将PDF存储到系统中时执行该例程,将其保存在一个数据库中,其中包含两个表,一个表包含PDF名称,另一个表(1-N)中包含文本,以

我正在尝试开发一个搜索工具,搜索所有PDF中的单词,结果将列出所有包含单词或术语的PDF。我是一个完全的初学者,不知道它是怎么回事。我试着在互联网上搜索,得到了一个来源

上面的项目链接可以很好地处理txt、css和php文件,但不能处理pdf扩展名

任何想法或解决方案都是好的。提前感谢。

您可以使用将pdf转换为文本,然后在文本中搜索您的单词。为了提高性能,我强烈建议您在将PDF存储到系统中时执行该例程,将其保存在一个数据库中,其中包含两个表,一个表包含PDF名称,另一个表(1-N)中包含文本,以供将来搜索。TL;DR您需要的是从数据库或后端使用一些命令来提取文件、存储他并进行全文搜索

使用PDF2Text类,您可以执行以下操作:

include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('youfile.pdf'); 
$a->decodePDF();
//use the db you want
sql = "insert into TABLEPDF (name, content) VALUES ('youfile', $a->output())"; 
之后,当用户将要搜索的关键字放入您的输入中时,只需搜索数据库,在搜索后(如果num_rows>0)列出包含该关键字的PDF:

$query = "SELECT name FROM TABLEPDF where content like '%$keyword%';
您也可以使用OCR类,以改进系统接受的文件:

这正是我想要的答案。谢谢你的解决方案