Python PDFMiner版本差异和xFF1F；获取不支持操作：查找_Python_Pdfminer_Unsupportedoperation

Python PDFMiner版本差异和xFF1F；获取不支持操作：查找

python

Python PDFMiner版本差异和xFF1F；获取不支持操作：查找,python,pdfminer,unsupportedoperation,Python,Pdfminer,Unsupportedoperation,我正在使用爬虫从网站上获取一些pdf文件，并尝试转换为txt，我在获取不支持操作时遇到了这个错误：seek 我已经搜索了很多网站，只是不能帮助我解决这个问题解析中第51行的文件“” praser_pdf=PDFParser（fp）文件“D:\Anaconda\lib\site packages\pdfminer\pdfparser.py”，第43行，在init PSStackParser.init（self，fp）文件“D:\Anaconda\lib\site packages\pdfmi

我正在使用爬虫从网站上获取一些pdf文件，并尝试转换为txt，我在获取不支持操作时遇到了这个错误：seek

我已经搜索了很多网站，只是不能帮助我解决这个问题

解析中第51行的文件“” praser_pdf=PDFParser（fp）

文件“D:\Anaconda\lib\site packages\pdfminer\pdfparser.py”，第43行，在init PSStackParser.init（self，fp）

文件“D:\Anaconda\lib\site packages\pdfminer\psparser.py”，第515行，位于init PSBaseParser.init（self，fp）

文件“D:\Anaconda\lib\site packages\pdfminer\psparser.py”，第169行，位于init self.seek（0）

文件“D:\Anaconda\lib\site packages\pdfminer\psparser.py”，第527行，在seek中 PSBaseParser.seek（self，pos）

文件“D:\Anaconda\lib\site packages\pdfminer\psparser.py”，第199行，在seek中 self.fp.seek（位置）

不支持操作：查找

这是我的密码

baseurl = "http://reportdocs.static.szse.cn/UpFiles/fxklwxhj/"

def parse(docucode):

_path = baseurl + quote(docucode) +"?random=0.3006649122149502"

request = Request(url=_path, headers=headers)  

fp = urlopen(request)

praser_pdf = PDFParser(fp)

doc = PDFDocument()

praser_pdf.set_document(doc)
doc.set_parser(praser_pdf)

doc.initialize()

代码无法工作，它只是在praser_pdf=PDFParser（fp）中出现故障，我真的很想知道如何修复它

非常感谢

这是一个从url读取pdf并写入输出文件的示例实现。注意：此实现适用于pdfminer:20191125，并且没有包括url响应的错误处理

from urllib.request import urlopen, Request
import os
pdf_url = "http://www.inkwelleditorial.com/pdfSample.pdf"
rp1 = Request(pdf_url)
fp = urlopen(rp1)
output_path = "/home/mint/Desktop/temper.html"
input_path = "/home/mint/Desktop/temper.pdf"

open(input_path, "w").close() # For making the output file as empty before going forward
with open(input_path, "wb") as f:
    f.write(fp.read())
command = "pdf2txt.py -t html -o {} {} ".format(output_path, input_path)
os.system(command)

您能提供您正在使用的pdfminer版本吗pdfminer的版本是20191125（最新版本）。谢谢command=“pdf2txt.py-t html-o{}{}”。格式化（输出文件，输入文件）os.system（命令）您可以这样使用，例如将fp的输出保存到文件中，将其作为输入文件加载，输出将保存在输出文件中。请确保将python脚本文件夹添加到您的路径中，或者如果参考需要，请使用pdf2txt.py的绝对路径。请详细说明如何将输出从fp保存到文件并将其作为输入文件加载？特别感谢！