Python中的PDFminer
我下载了pdfminer,命令行方法工作得很好,但我希望能够同时转换多个pdf文档,因此我尝试将pdfminer用作库,我发现这个os stackoverflow,但我无法让它工作Python中的PDFminer,python,pdf,Python,Pdf,我下载了pdfminer,命令行方法工作得很好,但我希望能够同时转换多个pdf文档,因此我尝试将pdfminer用作库,我发现这个os stackoverflow,但我无法让它工作 from pdfminer.pdfinterp import PDFResourceManager, process_pdf from pdfminer.converter import TextConverter from pdfminer.layout import LAParams from cStringIO
from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from cStringIO import StringIO
def convert_pdf(path):
rsrcmgr = PDFResourceManager()
retstr = StringIO()
codec = 'utf-8'
laparams = LAParams()
device = TextConverter(rsrcmgr, retstr, codec=codec, laparams=laparams)
fp = file(path, 'rb')
process_pdf(rsrcmgr, device, fp)
fp.close()
device.close()
str = retstr.getvalue()
retstr.close()
print str
convert_pdf("/Users/gorkemyurtseven/Desktop/casino.pdf")
当我运行它时,我得到:
Traceback (most recent call last):
File "pdfminer.py", line 1, in <module>
from pdfminer.pdfinterp import PDFResourceManager, process_pdf
File "/Users/gorkemyurtseven/Desktop/pdfminer.py", line 1, in <module>
from pdfminer.pdfinterp import PDFResourceManager, process_pdf
ImportError: No module named pdfinterp
回溯(最近一次呼叫最后一次):
文件“pdfminer.py”,第1行,在
从pdfminer.pdfinterp导入PDFResourceManager,处理\u pdf
文件“/Users/gorkemyurtseven/Desktop/pdfminer.py”,第1行,在
从pdfminer.pdfinterp导入PDFResourceManager,处理\u pdf
ImportError:没有名为pdfinterp的模块
似乎您正在将脚本pdfminer
作为模块调用,当尝试导入同名模块时,它会变得疯狂
另一个原因可能是pdfminer
模块安装不正确,或者它不是python发行版的正确版本。正如本文所解释的,问题是您的文件名为pdfminer.py
更改名称并删除创建的
\uuuu pycache\uuu/
目录和pdfminer.pyc
文件:
$ rm -r __pycache__/ pdfminer.pyc
$ mv pdfminer.py mypdfminer.py
import pdfminer
是否生成类似的ImportError
?pdfminer可能不在python路径上。如果是这样,您可能需要从pdfminer目录运行python setup.py install
。