Python Scrapy-需要帮助从样式属性中提取字符串吗
我试图弄清楚如何使用python和scrapy从style属性中提取图像src 这是标签:Python Scrapy-需要帮助从样式属性中提取字符串吗,python,scrapy,Python,Scrapy,我试图弄清楚如何使用python和scrapy从style属性中提取图像src 这是标签: <div class="media-img"><div class=" searched-img" style="background-image: url(https://media.ziparound.com.au/EEE/2/83B5-5588AF298562/1450507652885_dww-eegee.jpg);"></div> 我明白了 'backgro
<div class="media-img"><div class=" searched-img" style="background-image: url(https://media.ziparound.com.au/EEE/2/83B5-5588AF298562/1450507652885_dww-eegee.jpg);"></div>
我明白了
'background-image: url(https://media.ziparound.com.au/EEE/2/83B5-5588AF298562/1450507652885_dww-eegee.jpg);
但是我不知道如何提取图像src我想使用正则表达式的可能副本,另一个问题是没有正则表达式,加上我使用的是Scrapy,另一个解决方案是“你需要使用
response.xpath(//div[contains(@class,'media img')]/@style”).re_优先(r'url\([^\)]+)
@gangabass解决方案将起作用,但您应该使用类似于url\(.*)的内容代码>因为()
允许在url中不使用编码。我想使用正则表达式的可能重复,另一个问题是没有正则表达式,再加上我正在使用Scrapy,另一个解决方案是“您需要使用response.xpath(//div[contains(@class,'media img')]/@style”)。re_first(r'url\([^\)]+)
@gangabass解决方案将起作用,但您应该使用类似于url\(.*)的内容因为()
允许在URL中不使用编码。
'background-image: url(https://media.ziparound.com.au/EEE/2/83B5-5588AF298562/1450507652885_dww-eegee.jpg);