Database 如何使用python从pdf中提取文本并将信息转储到数据库中_Database_Python 2.7_Pdf

Database 如何使用python从pdf中提取文本并将信息转储到数据库中

database python-2.7 pdf

Database 如何使用python从pdf中提取文本并将信息转储到数据库中,database,python-2.7,pdf,Database,Python 2.7,Pdf,如何使用python从pdf中提取文本并将信息转储到数据库中？如何安装我尝试过这样做，但它显示出以下问题我看到你在Windows中，你是如何在Windows中安装它的！首先需要正确安装setup.py文件 cd C:\Users\User\Downloads\pyPDF2进入setup.py所在的目录 C:\python27\python.exe setup.py安装我在这里使用Python2.7。对python 3.3使用C:\python33\python.exe setup.py安装

如何使用python从pdf中提取文本并将信息转储到数据库中？如何安装

我尝试过这样做，但它显示出以下问题

我看到你在Windows中，你是如何在Windows中安装它的！首先需要正确安装setup.py文件

cd C:\Users\User\Downloads\pyPDF2进入setup.py所在的目录
C:\python27\python.exe setup.py安装我在这里使用Python2.7。对python 3.3使用C:\python33\python.exe setup.py安装，依此类推

这是最快的方法（检查源代码！！）

关于如何提取它，有很多教程。你应该遵守官方文件和值得信赖的网站！这就是一个例子

from PyPDF2 import PdfFileReader
def text_extractor(path):
    with open(path, 'rb') as f:
        pdf = PdfFileReader(f)
        # get the first page
        page = pdf.getPage(1)
        print(page)
        print('Page type: {}'.format(str(type(page))))
        text = page.extractText()
        print(text)
if __name__ == '__main__':
    path = 'reportlab-sample.pdf'
    text_extractor(path)

如何安装pypdf2？我不确定您是否阅读了我的答案。至少上半场没有。在这里，我给你一个资源，并告诉你怎么做@AyuShigarReading上的下载错误：超时--可能找不到某些程序包！找不到“PyPDF2”的索引页（可能拼写错误？）扫描所有包的索引（这可能需要一段时间）读取下载错误：超时-可能找不到某些包！找不到PyPDF2的本地包或工作下载链接错误：找不到适合需求的分发版。parse（'PyPDF2'）--未发生。是否尝试其他安装方式（如我提供给您的链接所示）@Ayushigarg请添加足够的详细信息，以便其他人理解问题。另外，请提及您面临的例外情况和问题。