Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/322.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何从Spider手动将URL添加到DupeFilter_Python_Scrapy_Scrapy Spider - Fatal编程技术网

Python 如何从Spider手动将URL添加到DupeFilter

Python 如何从Spider手动将URL添加到DupeFilter,python,scrapy,scrapy-spider,Python,Scrapy,Scrapy Spider,我目前正在努力寻找一种方法,从我的Spider中访问DupeFilter对象 如果我可以访问它,那么我可以将另一个指纹添加到指纹集。因此,看起来您必须深入挖掘才能找到DupeFilter:self.crawler.engine.slot.scheduler.df 因此,添加指纹将如下所示: def parse_page(self, response): # ... dupe_filter = self.crawler.engine.slot.scheduler.df d

我目前正在努力寻找一种方法,从我的
Spider
中访问
DupeFilter
对象


如果我可以访问它,那么我可以将另一个指纹添加到指纹集。

因此,看起来您必须深入挖掘才能找到
DupeFilter
self.crawler.engine.slot.scheduler.df

因此,添加指纹将如下所示:

def parse_page(self, response):
    # ...

    dupe_filter = self.crawler.engine.slot.scheduler.df
    dummy_request = Request('http://example.com/thing/9964')
    fingerprint = dupe_filter.request_fingerprint(dummy_request)
    dupe_filter.fingerprints.add(fingerprint)

    # ...