Database 如何使用python从pdf中提取文本并将信息转储到数据库中

Database 如何使用python从pdf中提取文本并将信息转储到数据库中,database,python-2.7,pdf,Database,Python 2.7,Pdf,如何使用python从pdf中提取文本并将信息转储到数据库中? 如何安装 我尝试过这样做,但它显示出以下问题我看到你在Windows中,你是如何在Windows中安装它的!首先需要正确安装setup.py文件 cd C:\Users\User\Downloads\pyPDF2进入setup.py所在的目录 C:\python27\python.exe setup.py安装我在这里使用Python2.7。对python 3.3使用C:\python33\python.exe setup.py安装

如何使用python从pdf中提取文本并将信息转储到数据库中? 如何安装


我尝试过这样做,但它显示出以下问题

我看到你在Windows中,你是如何在Windows中安装它的!首先需要正确安装setup.py文件

  • cd C:\Users\User\Downloads\pyPDF2进入setup.py所在的目录
  • C:\python27\python.exe setup.py安装我在这里使用Python2.7。对python 3.3使用C:\python33\python.exe setup.py安装,依此类推
这是最快的方法(检查源代码!!)

关于如何提取它,有很多教程。你应该遵守官方文件和值得信赖的网站!这就是一个例子

from PyPDF2 import PdfFileReader
def text_extractor(path):
    with open(path, 'rb') as f:
        pdf = PdfFileReader(f)
        # get the first page
        page = pdf.getPage(1)
        print(page)
        print('Page type: {}'.format(str(type(page))))
        text = page.extractText()
        print(text)
if __name__ == '__main__':
    path = 'reportlab-sample.pdf'
    text_extractor(path)

如何安装pypdf2?我不确定您是否阅读了我的答案。至少上半场没有。在这里,我给你一个资源,并告诉你怎么做@AyuShigarReading上的下载错误:超时--可能找不到某些程序包!找不到“PyPDF2”的索引页(可能拼写错误?)扫描所有包的索引(这可能需要一段时间)读取下载错误:超时-可能找不到某些包!找不到PyPDF2的本地包或工作下载链接错误:找不到适合需求的分发版。parse('PyPDF2')--未发生。是否尝试其他安装方式(如我提供给您的链接所示)@Ayushigarg请添加足够的详细信息,以便其他人理解问题。另外,请提及您面临的例外情况和问题。