Python中的PDFminer_Python_Pdf - Fatal编程技术网

Python中的PDFminer

python pdf

Python中的PDFminer,python,pdf,Python,Pdf,我下载了pdfminer，命令行方法工作得很好，但我希望能够同时转换多个pdf文档，因此我尝试将pdfminer用作库，我发现这个os stackoverflow，但我无法让它工作 from pdfminer.pdfinterp import PDFResourceManager, process_pdf from pdfminer.converter import TextConverter from pdfminer.layout import LAParams from cStringIO

我下载了pdfminer，命令行方法工作得很好，但我希望能够同时转换多个pdf文档，因此我尝试将pdfminer用作库，我发现这个os stackoverflow，但我无法让它工作

from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from cStringIO import StringIO



def convert_pdf(path):

    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    codec = 'utf-8'
    laparams = LAParams()
    device = TextConverter(rsrcmgr, retstr, codec=codec, laparams=laparams)

    fp = file(path, 'rb')
    process_pdf(rsrcmgr, device, fp)
    fp.close()
    device.close()

    str = retstr.getvalue()
    retstr.close()
    print str


convert_pdf("/Users/gorkemyurtseven/Desktop/casino.pdf")

当我运行它时，我得到：

Traceback (most recent call last):
  File "pdfminer.py", line 1, in <module>
    from pdfminer.pdfinterp import PDFResourceManager, process_pdf
  File "/Users/gorkemyurtseven/Desktop/pdfminer.py", line 1, in <module>
    from pdfminer.pdfinterp import PDFResourceManager, process_pdf
ImportError: No module named pdfinterp

回溯（最近一次呼叫最后一次）：
文件“pdfminer.py”，第1行，在
从pdfminer.pdfinterp导入PDFResourceManager，处理\u pdf
文件“/Users/gorkemyurtseven/Desktop/pdfminer.py”，第1行，在
从pdfminer.pdfinterp导入PDFResourceManager，处理\u pdf
ImportError:没有名为pdfinterp的模块

似乎您正在将脚本

pdfminer

作为模块调用，当尝试导入同名模块时，它会变得疯狂

另一个原因可能是

pdfminer

模块安装不正确，或者它不是python发行版的正确版本。

正如本文所解释的，问题是您的文件名为

pdfminer.py

更改名称并删除创建的

\uuuu pycache\uuu/

目录和

pdfminer.pyc

文件：

$ rm -r __pycache__/ pdfminer.pyc
$ mv pdfminer.py mypdfminer.py

import pdfminer

是否生成类似的

ImportError

？pdfminer可能不在python路径上。如果是这样，您可能需要从pdfminer目录运行

python setup.py install

。