Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/sorting/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Web scraping Scrapy,在现有spider登录后使用shell访问页面。。。(登录,然后从那里开始)_Web Scraping_Scrapy - Fatal编程技术网

Web scraping Scrapy,在现有spider登录后使用shell访问页面。。。(登录,然后从那里开始)

Web scraping Scrapy,在现有spider登录后使用shell访问页面。。。(登录,然后从那里开始),web-scraping,scrapy,Web Scraping,Scrapy,我正在阅读并看到我可以访问Scrpay Shell,如scrapy Shell“http://quotes.toscrape.com/page/1/“ 我只需要抓取我需要的所有网站 使用uname/passwd(存储在方法中)登录 转到带有分页的概述页面 从那里打开各个产品页面(在那里我们可以刮取实际数据) 问题:如何使用shell按名称启动1个现有的spider。然后让它登录并停止,这样我就可以使用shell访问响应了 问题:如何让它停在第一个分类页面上?或者我怎样才能让它停在第一个产品页

我正在阅读并看到我可以访问Scrpay Shell,如
scrapy Shell“http://quotes.toscrape.com/page/1/“

我只需要抓取我需要的所有网站

  • 使用uname/passwd(存储在方法中)登录
  • 转到带有分页的概述页面
  • 从那里打开各个产品页面(在那里我们可以刮取实际数据)
问题:如何使用shell按名称启动1个现有的spider。然后让它登录并停止,这样我就可以使用shell访问响应了

问题:如何让它停在第一个分类页面上?或者我怎样才能让它停在第一个产品页面上


谢谢!感谢您的反馈

启动刮板并访问特定页面上的刮壳的最简单方法是将以下内容放入您希望看到响应的方法中:

def parse(self, response)
    from scrapy.shell import inspect_response
    inspect_response(response, self)
当您使用
scrapy crawl…
启动爬行器时,它将打开scrapy shell,您可以在其中检查响应