使用Python3解析远程pdf文件&;PyPDF2
我需要解析一个远程pdf文件。对于PyPDF2,它可以通过使用Python3解析远程pdf文件&;PyPDF2,pdf,python-3.x,decode,pypdf,Pdf,Python 3.x,Decode,Pypdf,我需要解析一个远程pdf文件。对于PyPDF2,它可以通过PdfReader(f)完成,其中f=urllib.request.urlopen(“某些url”).read()。PDF阅读器不能使用f,似乎必须对f进行解码。decode()中应该使用什么参数,或者必须使用其他方法。您需要使用: f = urllib.request.urlopen("some-url").read() 在上述行之后添加以下行: from StringIO import StringIO f = StringIO(
PdfReader(f)
完成,其中f=urllib.request.urlopen(“某些url”).read()。PDF阅读器不能使用f,似乎必须对f进行解码。decode()中应该使用什么参数,或者必须使用其他方法。您需要使用:
f = urllib.request.urlopen("some-url").read()
在上述行之后添加以下行:
from StringIO import StringIO
f = StringIO(f)
然后使用PdfReader读取如下内容:
reader = PdfReader(f)
另外,请参阅:您需要使用:
f = urllib.request.urlopen("some-url").read()
在上述行之后添加以下行:
from StringIO import StringIO
f = StringIO(f)
然后使用PdfReader读取如下内容:
reader = PdfReader(f)
另请参阅: