Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/spring-mvc/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
从pdf中提取文本的最佳perl模块是什么?_Perl_Pdf_Text_Extraction - Fatal编程技术网

从pdf中提取文本的最佳perl模块是什么?

从pdf中提取文本的最佳perl模块是什么?,perl,pdf,text,extraction,Perl,Pdf,Text,Extraction,从pdf中提取文本的最佳方法是什么?该模块对于提取文本和维护文档中文本来源的一些信息非常有用。它安装/usr/local/bin/getpdftext.pl,它演示了简单的提取。但是,CAM::PDF只能读取完全有效的PDF。 如果您处理的是格式错误的PDF,则可能需要更宽松的解析器,如pdftotext。它将foo.pdf转储到foo.txt,然后您可以将其读入Perl。类似的问题可能有用:第一篇文章不错!欢迎来到StackOverflow,谢谢。获得同时发布两个链接这样的特权很好。:)

从pdf中提取文本的最佳方法是什么?

该模块对于提取文本和维护文档中文本来源的一些信息非常有用。它安装/usr/local/bin/getpdftext.pl,它演示了简单的提取。但是,CAM::PDF只能读取完全有效的PDF。
如果您处理的是格式错误的PDF,则可能需要更宽松的解析器,如pdftotext。它将foo.pdf转储到foo.txt,然后您可以将其读入Perl。

类似的问题可能有用:第一篇文章不错!欢迎来到StackOverflow,谢谢。获得同时发布两个链接这样的特权很好。:)