Web crawler 刮板机、爬虫和蜘蛛在刮板机环境中的区别_Web Crawler_Scrapy_Scrapy Spider

Web crawler 刮板机、爬虫和蜘蛛在刮板机环境中的区别

web-crawler scrapy

Web crawler 刮板机、爬虫和蜘蛛在刮板机环境中的区别,web-crawler,scrapy,scrapy-spider,Web Crawler,Scrapy,Scrapy Spider,试着读懂Scrapy的代码。scaper、crawler和spider这三个词令人困惑。比如说 scrapy.core.scraper scrapy.crawler scrapy.spiders 有人能解释一下这些术语在Scrapy语境中的含义和区别吗？提前感谢。Crawler（scrapy.Crawler）是scrapy API的主要入口点。它提供了对所有Scrapy核心组件的访问，并用于将扩展功能挂钩到Scrapy中 Scraper（scrapy.core.Scraper）组件负责解析响应

试着读懂Scrapy的代码。scaper、crawler和spider这三个词令人困惑。比如说

scrapy.core.scraper
scrapy.crawler
scrapy.spiders

有人能解释一下这些术语在Scrapy语境中的含义和区别吗？提前感谢。

Crawler（

scrapy.Crawler

）是scrapy API的主要入口点。它提供了对所有Scrapy核心组件的访问，并用于将扩展功能挂钩到Scrapy中

Scraper（

scrapy.core.Scraper

）组件负责解析响应并从中提取信息。它是通过引擎运行的，用来运行你的蜘蛛

scrapy.Spider
是一个包含基本

Spider

实现（用于编写Spider）的模块，以及一些现成的常用Spider（如用于基于规则集的爬行的爬行器、用于基于站点地图的爬行的SitemapSpider或用于爬行XML提要的XMLFeedSpider）

更多信息请参见官方文档页面：

“解析响应和提取信息”：是蜘蛛吗？是的，刮板组件负责运行蜘蛛。