Python 潦草的文字_Python_Csv_Scrapy_Scrapy Spider

Python 潦草的文字

python csv scrapy

Python 潦草的文字,python,csv,scrapy,scrapy-spider,Python,Csv,Scrapy,Scrapy Spider,作为一名新用户，我设法让一只蜘蛛可以在电子商务网站上嬉戏，并从中提取信息每个产品的标题和变体以及输出CSV文件和产品线，但我希望这是一个由行的变化，请有人能帮助我在我的项目前进我期待着回答这个问题，但不幸的是我找不到答案我的蜘蛛： import scrapy from w3lib.html import remove_tags from products_crawler.items import ProductItem class DemostoreSpider(scrapy.Spi

作为一名新用户，我设法让一只蜘蛛可以在电子商务网站上嬉戏，并从中提取信息每个产品的标题和变体以及输出CSV文件和产品线，但我希望这是一个由行的变化，请有人能帮助我在我的项目前进

我期待着回答这个问题，但不幸的是我找不到答案

我的蜘蛛：

import scrapy
from w3lib.html import remove_tags
from products_crawler.items import ProductItem


class DemostoreSpider(scrapy.Spider):
    name = "demostore"
    allowed_domains = ["adns-grossiste.fr"]
    start_urls = [
         'http://adns-grossiste.fr/17-produits-recommandes',
]
download_delay = 0.5

def parse(self, response):
    for category_url in response.css('#categories_block_left > div > ul  > li ::attr(href)').extract():
        yield scrapy.Request(category_url, callback=self.parse_category, meta={'page_number': '1'})

def parse_category(self, response):
    for product_url in response.css('#center_column > ul > li > div > div.right-block > h5 > a ::attr(href)').extract():
        yield scrapy.Request(product_url, callback=self.parse_product)

def parse_product(self, response):
    item = ProductItem()
    item['url'] = response.url
    item['title'] = response.css('#center_column > div >   div.primary_block.clearfix > div.pb-center-column.col-xs-12.col-sm-7.col- md-7.col-lg-7 > h1 ::text').extract_first()
    item['Déclinaisons'] = remove_tags(response.css('#d_c_1852 > tbody   >tr.combi_1852.\31 852_155.\31 852_26.odd > td.tl.sorting_1 > a > span  ::text').extract_first() or '')
    yield item

示例CSV希望：退房

简而言之，有两种方法，最简单的方法就是使用crawl命令参数

--output

或简而言之

-o

。例如：

scrapy crawl myspider -o myspider.csv

Scrapy将自动将生成的项目转换为csv文件。有关更详细的方法，请查看开头发布的文档页面。

可能重复的