Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/php/259.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php-pdf解析器_Php_Parsing_Pdf - Fatal编程技术网

Php-pdf解析器

Php-pdf解析器,php,parsing,pdf,Php,Parsing,Pdf,我试图找到一个pdf解析器。我在stackoverflow中搜索,但没有令人满意的答案。有人说Zend这样做很好,但我不想使用它。有好的班级来做这件事吗 我不知道您需要进行多深的pdf解析,但我最近做了一些工作,将pdf文本提取到json字符串中。它还将提取图像,但如果您不需要它们,仍然可以在pdfreader/main.py中的run函数中对这两行进行注释 extract_images(pdf_file) dict_book = get_images_update_dict(dict_book

我试图找到一个pdf解析器。我在stackoverflow中搜索,但没有令人满意的答案。有人说Zend这样做很好,但我不想使用它。有好的班级来做这件事吗

我不知道您需要进行多深的pdf解析,但我最近做了一些工作,将pdf文本提取到json字符串中。它还将提取图像,但如果您不需要它们,仍然可以在pdfreader/main.py中的run函数中对这两行进行注释

extract_images(pdf_file)
dict_book = get_images_update_dict(dict_book, image_folder)
是的,它是用python编写的,不是用php编写的,但是您可以通过以下方式以json的形式返回结果:

exec("./parser.py pdfreader/book.pdf './images/' 2>&1", $output);
$data = json_decode($output)
var_dump($data);

你为什么不想用Zend?有什么特别的原因,或者只是对Zend的所有东西都不喜欢吗?我认为Zend适合大型项目。我只想阅读两份pdf。您不需要使用整个Zend Framework来阅读pdf,只需选择您想要的组件/need.pdflib无法执行此操作。它只生成pdf文件。