Web crawler 刮板机、爬虫和蜘蛛在刮板机环境中的区别

Web crawler 刮板机、爬虫和蜘蛛在刮板机环境中的区别,web-crawler,scrapy,scrapy-spider,Web Crawler,Scrapy,Scrapy Spider,试着读懂Scrapy的代码。scaper、crawler和spider这三个词令人困惑。比如说 scrapy.core.scraper scrapy.crawler scrapy.spiders 有人能解释一下这些术语在Scrapy语境中的含义和区别吗?提前感谢。Crawler(scrapy.Crawler)是scrapy API的主要入口点。它提供了对所有Scrapy核心组件的访问,并用于将扩展功能挂钩到Scrapy中 Scraper(scrapy.core.Scraper)组件负责解析响应

试着读懂Scrapy的代码。scaper、crawler和spider这三个词令人困惑。比如说

scrapy.core.scraper
scrapy.crawler
scrapy.spiders
有人能解释一下这些术语在Scrapy语境中的含义和区别吗?提前感谢。

Crawler
scrapy.Crawler
)是scrapy API的主要入口点。它提供了对所有Scrapy核心组件的访问,并用于将扩展功能挂钩到Scrapy中

Scraper
scrapy.core.Scraper
)组件负责解析响应并从中提取信息。它是通过引擎运行的,用来运行你的蜘蛛

scrapy.Spider
是一个包含基本
Spider
实现(用于编写Spider)的模块,以及一些现成的常用Spider(如用于基于规则集的爬行的爬行器、用于基于站点地图的爬行的SitemapSpider或用于爬行XML提要的XMLFeedSpider)

更多信息请参见官方文档页面:

“解析响应和提取信息”:是蜘蛛吗?是的,刮板组件负责运行蜘蛛。