Python 图像处理中的刮擦误差
我正在尝试使用scrapy下载图像,但我遇到了错误…我知道这个问题,但我不知道如何解决它…这是图片 由于他们的身份是与URL相关联的某种ID,比如:Python 图像处理中的刮擦误差,python,web-scraping,scrapy,Python,Web Scraping,Scrapy,我正在尝试使用scrapy下载图像,但我遇到了错误…我知道这个问题,但我不知道如何解决它…这是图片 由于他们的身份是与URL相关联的某种ID,比如:jpg?1368772608 我得到这个错误: File "/usr/lib/python2.7/dist-packages/PIL/Image.py", line 1423, in save raise KeyError(ext) # unknown extension exceptions.KeyError: '.jpg?136877
jpg?1368772608
我得到这个错误:
File "/usr/lib/python2.7/dist-packages/PIL/Image.py", line 1423, in save
raise KeyError(ext) # unknown extension
exceptions.KeyError: '.jpg?1368772608'
有人能告诉我如何解决这个问题吗?这将在以后删除该部分?以便PIL能够识别图像扩展:
>>> url = 'http://images.styletagassets.com/attachments/98315/product/WTSMIC0003_2.jpg?1368772608'
>>> url.split('?')[0]
'http://images.styletagassets.com/attachments/98315/product/WTSMIC0003_2.jpg'
这定义了一个返回正确url的函数。它允许
?
出现在url中而不被删除。您可以单击以测试我输出的url
import re
url = r"http://images.styletagassets.com/attachments/98315/product/WTSMIC0003_2.jpg?1368772608"
def fix(url):
return re.match("(.+?)(?=\?\d+)",url).group()
print(fix(url))
>>>
http://images.styletagassets.com/attachments/98315/product/WTSMIC0003_2.jpg
如何在
之后删除该部分?
以便PIL
可以识别图像扩展名…当然可以,但这是一个图像url。