Python scrapy.Reaquests（）回调不起作用_Python_Scrapy

Python scrapy.Reaquests（）回调不起作用

python scrapy

Python scrapy.Reaquests（）回调不起作用,python,scrapy,Python,Scrapy,尽管有很多问题，但大多数人都会遇到这个问题，因为“dont\u filter”参数。我传递了这个参数“dont\u filter=True”，但我的自定义解析生成器仍然无法工作。下面是我的代码（第三个解析器“parse\u spec”从未调用过，“parse\u models\u follow\u next\u page“只要在parse（）调用时工作正常，但在需要转到下一页时无法调用自身）：很抱歉我的英语不好。我对代码做了一些更改，它删除了除规范名称以外的所有结果，规范名称没有以理解的方式指

尽管有很多问题，但大多数人都会遇到这个问题，因为“dont\u filter”参数。我传递了这个参数“dont\u filter=True”，但我的自定义解析生成器仍然无法工作。下面是我的代码（第三个解析器“parse\u spec”从未调用过，“parse\u models\u follow\u next\u page“只要在parse（）调用时工作正常，但在需要转到下一页时无法调用自身）：

很抱歉我的英语不好。

我对代码做了一些更改，它删除了除规范名称以外的所有结果，规范名称没有以理解的方式指定

进口羊瘙痒

从lxml导入html

从tutorial.items导入PhoneItems

类供应商分拣机（刮擦式分拣机）：

你没有什么问题

allowed_domains = ["https://www.gsmarena.com/"]

应该是

allowed_domains = ["www.gsmarena.com"]

for spec_name, spec in zip(response.xpath('//table//td[1]/text()').extract(), response.xpath('//table//td[2]/text()').extract()):

接下来，您的类中没有定义

errback\u httpbin

方法

def errback_httpbin(self, response):
    pass

以下代码

for spec_name, spec in zip(response.xpath('//table//td[1]').extract(), response.xpath('//table//td[2]').extract()):

应该是

allowed_domains = ["www.gsmarena.com"]

for spec_name, spec in zip(response.xpath('//table//td[1]/text()').extract(), response.xpath('//table//td[2]/text()').extract()):

但这仍然存在一些问题

此外，您的代码在第一次生成时也需要一些时间，因为调度程序将根据url进入的顺序选择url

在我这方面工作正常：

{'model'：'45 Titanium'，'我定义了errback_httpbin函数，但忘了在这里发布，对此表示抱歉。谢谢你的建议。你是对的，我只是需要更多的耐心。我再次尝试了我的脚本，第三个paser在几十秒后被调用。这是我第一次使用scrapy，我认为它会按顺序工作。谢谢非常感谢你。你的代码工作得很好，感谢你的辛勤工作。规格名称用于记录智能手机的一些规格，如cpu、屏幕大小等。