Python 图像处理中的刮擦误差_Python_Web Scraping_Scrapy

Python 图像处理中的刮擦误差

python web-scraping scrapy

Python 图像处理中的刮擦误差,python,web-scraping,scrapy,Python,Web Scraping,Scrapy,我正在尝试使用scrapy下载图像，但我遇到了错误…我知道这个问题，但我不知道如何解决它…这是图片由于他们的身份是与URL相关联的某种ID，比如：jpg？1368772608 我得到这个错误： File "/usr/lib/python2.7/dist-packages/PIL/Image.py", line 1423, in save raise KeyError(ext) # unknown extension exceptions.KeyError: '.jpg?136877

我正在尝试使用scrapy下载图像，但我遇到了错误…我知道这个问题，但我不知道如何解决它…这是图片

由于他们的身份是与URL相关联的某种ID，比如：

jpg？1368772608

我得到这个错误：

  File "/usr/lib/python2.7/dist-packages/PIL/Image.py", line 1423, in save
    raise KeyError(ext) # unknown extension
exceptions.KeyError: '.jpg?1368772608'

有人能告诉我如何解决这个问题吗？

这将在以后删除该部分？以便PIL能够识别图像扩展：

>>> url = 'http://images.styletagassets.com/attachments/98315/product/WTSMIC0003_2.jpg?1368772608'
>>> url.split('?')[0]

'http://images.styletagassets.com/attachments/98315/product/WTSMIC0003_2.jpg'

这定义了一个返回正确url的函数。它允许

？

出现在url中而不被删除。您可以单击以测试我输出的url

import re
url = r"http://images.styletagassets.com/attachments/98315/product/WTSMIC0003_2.jpg?1368772608"
def fix(url):
    return re.match("(.+?)(?=\?\d+)",url).group()
print(fix(url))
>>> 
http://images.styletagassets.com/attachments/98315/product/WTSMIC0003_2.jpg

如何在

之后删除该部分？

以便

PIL

可以识别图像扩展名…当然可以，但这是一个图像url。