Database 如何使用python从pdf中提取文本并将信息转储到数据库中
如何使用python从pdf中提取文本并将信息转储到数据库中? 如何安装Database 如何使用python从pdf中提取文本并将信息转储到数据库中,database,python-2.7,pdf,Database,Python 2.7,Pdf,如何使用python从pdf中提取文本并将信息转储到数据库中? 如何安装 我尝试过这样做,但它显示出以下问题我看到你在Windows中,你是如何在Windows中安装它的!首先需要正确安装setup.py文件 cd C:\Users\User\Downloads\pyPDF2进入setup.py所在的目录 C:\python27\python.exe setup.py安装我在这里使用Python2.7。对python 3.3使用C:\python33\python.exe setup.py安装
我尝试过这样做,但它显示出以下问题我看到你在Windows中,你是如何在Windows中安装它的!首先需要正确安装setup.py文件
- cd C:\Users\User\Downloads\pyPDF2进入setup.py所在的目录
- C:\python27\python.exe setup.py安装我在这里使用Python2.7。对python 3.3使用C:\python33\python.exe setup.py安装,依此类推李>
from PyPDF2 import PdfFileReader
def text_extractor(path):
with open(path, 'rb') as f:
pdf = PdfFileReader(f)
# get the first page
page = pdf.getPage(1)
print(page)
print('Page type: {}'.format(str(type(page))))
text = page.extractText()
print(text)
if __name__ == '__main__':
path = 'reportlab-sample.pdf'
text_extractor(path)
如何安装pypdf2?我不确定您是否阅读了我的答案。至少上半场没有。在这里,我给你一个资源,并告诉你怎么做@AyuShigarReading上的下载错误:超时--可能找不到某些程序包!找不到“PyPDF2”的索引页(可能拼写错误?)扫描所有包的索引(这可能需要一段时间)读取下载错误:超时-可能找不到某些包!找不到PyPDF2的本地包或工作下载链接错误:找不到适合需求的分发版。parse('PyPDF2')--未发生。是否尝试其他安装方式(如我提供给您的链接所示)@Ayushigarg请添加足够的详细信息,以便其他人理解问题。另外,请提及您面临的例外情况和问题。