Python scrapy.Reaquests()回调不起作用

Python scrapy.Reaquests()回调不起作用,python,scrapy,Python,Scrapy,尽管有很多问题,但大多数人都会遇到这个问题,因为“dont\u filter”参数。我传递了这个参数“dont\u filter=True”,但我的自定义解析生成器仍然无法工作。下面是我的代码(第三个解析器“parse\u spec”从未调用过,“parse\u models\u follow\u next\u page“只要在parse()调用时工作正常,但在需要转到下一页时无法调用自身): 很抱歉我的英语不好。我对代码做了一些更改,它删除了除规范名称以外的所有结果,规范名称没有以理解的方式指

尽管有很多问题,但大多数人都会遇到这个问题,因为“dont\u filter”参数。我传递了这个参数“dont\u filter=True”,但我的自定义解析生成器仍然无法工作。下面是我的代码(第三个解析器“parse\u spec”从未调用过,“parse\u models\u follow\u next\u page“只要在parse()调用时工作正常,但在需要转到下一页时无法调用自身):


很抱歉我的英语不好。

我对代码做了一些更改,它删除了除规范名称以外的所有结果,规范名称没有以理解的方式指定

进口羊瘙痒

从lxml导入html

从tutorial.items导入PhoneItems

类供应商分拣机(刮擦式分拣机):


你没有什么问题

allowed_domains = ["https://www.gsmarena.com/"]
应该是

allowed_domains = ["www.gsmarena.com"]
for spec_name, spec in zip(response.xpath('//table//td[1]/text()').extract(), response.xpath('//table//td[2]/text()').extract()):
接下来,您的类中没有定义
errback\u httpbin
方法

def errback_httpbin(self, response):
    pass
以下代码

for spec_name, spec in zip(response.xpath('//table//td[1]').extract(), response.xpath('//table//td[2]').extract()):
应该是

allowed_domains = ["www.gsmarena.com"]
for spec_name, spec in zip(response.xpath('//table//td[1]/text()').extract(), response.xpath('//table//td[2]/text()').extract()):
但这仍然存在一些问题


此外,您的代码在第一次生成时也需要一些时间,因为调度程序将根据url进入的顺序选择url

在我这方面工作正常:
{'model':'45 Titanium','我定义了errback_httpbin函数,但忘了在这里发布,对此表示抱歉。谢谢你的建议。你是对的,我只是需要更多的耐心。我再次尝试了我的脚本,第三个paser在几十秒后被调用。这是我第一次使用scrapy,我认为它会按顺序工作。谢谢非常感谢你。你的代码工作得很好,感谢你的辛勤工作。规格名称用于记录智能手机的一些规格,如cpu、屏幕大小等。