Python 蜘蛛爬行0页
我需要从以下页面中删除所有价格和型号:Python 蜘蛛爬行0页,python,web-scraping,scrapy,Python,Web Scraping,Scrapy,我需要从以下页面中删除所有价格和型号: ..... 35/139东京 ..... 模式3 ..... 2459 KČ .. .... 诸如此类,每一个李都持有这个品牌的模型 我已经为此创建了一个spider类: import scrapy EyreimSpider类(刮毛蜘蛛): name=“eyerim” def start_请求(自我): URL=[ 'http://eyerim.cz/brand/35-139-tokyo/' ] 对于url中的u
.....
35/139东京
.....
107-0001 BEKKO2
.....
2349 KČ
..
.....
35/139东京
.....
模式3
.....
2459 KČ
..
....
诸如此类,每一个李都持有这个品牌的模型
我已经为此创建了一个spider类:
import scrapy
EyreimSpider类(刮毛蜘蛛):
name=“eyerim”
def start_请求(自我):
URL=[
'http://eyerim.cz/brand/35-139-tokyo/'
]
对于url中的url:
生成scrapy.Request(url=url,callback=self.parse)
def解析(自我,响应):
对于response.css中的模型('li.item.col-sm-4.colxs-6'):#保存所有模型
屈服{
#“产品名称”:models.css('span.product name').get(),
#“price”:models.css('span.price::text').get().partition('K')[0].rstrip().replace(u'\xa0',u'),
“model”:models.css('span.model::text').extract(),
'price':models.css('span::attr(content)').extract()
}
但当我运行spider时,没有结果:
Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
css表达式工作时,我已经在废弃的shell中尝试了所有表达式,它们返回结果。。。。我想从昨天开始弄明白,但没有成功。。。有什么想法吗??建议???就我所看到的示例代码而言,非常感谢。您在css项selsector中键入了
colxs-6
而不是col-xs-6
因为scrapy找不到类为
colxs-6
->的元素。parse
方法无法检索数据