PDF文件在使用python的request.get()之后已损坏
所以我有这个简单的代码,但每次我试图打开下载的pdf文件时,它都会说,它被破坏了。它适用于我找到的大多数测试PDF文件,所以我知道,这是一个问题,但我不知道,如何修复它PDF文件在使用python的request.get()之后已损坏,python,pdf,request,Python,Pdf,Request,所以我有这个简单的代码,但每次我试图打开下载的pdf文件时,它都会说,它被破坏了。它适用于我找到的大多数测试PDF文件,所以我知道,这是一个问题,但我不知道,如何修复它 import requests url = 'https://link.springer.com/content/pdf/10.1007%2F978-3-662-58392-0.pdf' r = requests.get(url) with open('python.pdf', 'wb') as f: f.write
import requests
url = 'https://link.springer.com/content/pdf/10.1007%2F978-3-662-58392-0.pdf'
r = requests.get(url)
with open('python.pdf', 'wb') as f:
f.write(r.content)
访问该URL将重定向到。它不下载pdf
保存到
python.pdf
的是网页的HTML,这就是pdf读者认为网页已损坏的原因。访问该URL会重定向到。它不下载pdf
您保存到
python.pdf
的是网页的HTML,这就是pdf读者认为它已损坏的原因。我想知道出版商的链接是否不起作用,因为它没有将会话识别为具有付费访问权限的会话
请尝试此scihub链接:https://sci-hub.tw/https://link.springer.com/content/pdf/10.1007%2F978-3-662-58392-0.pdf
编辑:忘了添加一点,您需要对它进行一些争论,以便将pdf从右侧显示的pdf查看器div中拉出。这个关于从scihub获取pdf的问题的答案应该很有效:我想知道出版商的链接是否不起作用,因为它没有将会话识别为具有付费访问权限的会话 请尝试此scihub链接:
https://sci-hub.tw/https://link.springer.com/content/pdf/10.1007%2F978-3-662-58392-0.pdf
编辑:忘了添加一点,您需要对它进行一些争论,以便将pdf从右侧显示的pdf查看器div中拉出。对于从scihub提取pdf的问题,这个答案应该很有效:在浏览器中输入URL,然后查看重定向的方式。好的,这就是问题所在,因为如果我输入URL,我会在浏览器中获取pdf,可能是因为我登录了,并且有权下载此pdf。我也可以从我的浏览器下载它,但我想用python试试。你知道一个可能的解决办法吗@ThierrylayHuille在您的浏览器中输入URL并查看如何重定向。好的,这是一个问题,因为如果我输入URL,我会在浏览器中获取pdf,可能是因为我登录了,并且有权下载此pdf。我也可以从我的浏览器下载它,但我想用python试试。你知道一个可能的解决办法吗@蒂尔里拉维尔