Python 修改现有的刮擦蜘蛛网站实施了验证码-如何获得一个图像,弹出解码和继续?
我有一个现有的scrapy spider,它可以抓取一个公共记录站点,这个spider工作得很好,但是他们添加了一个captcha弹出窗口,破坏了这个spider(原始程序员不可用) 我试图了解如何修改现有的spider来处理这个问题 例如: 如果我点击“接受”按钮,就会弹出验证码表单 我可以从我的浏览器右键点击并保存图像,事实上,我可以通过浮动在那里的decaptcha API之一对其进行解码。但是我对scrapy非常陌生,所以我需要一些帮助来了解如何提取图像并处理它Python 修改现有的刮擦蜘蛛网站实施了验证码-如何获得一个图像,弹出解码和继续?,python,scrapy,captcha,web-crawler,Python,Scrapy,Captcha,Web Crawler,我有一个现有的scrapy spider,它可以抓取一个公共记录站点,这个spider工作得很好,但是他们添加了一个captcha弹出窗口,破坏了这个spider(原始程序员不可用) 我试图了解如何修改现有的spider来处理这个问题 例如: 如果我点击“接受”按钮,就会弹出验证码表单 我可以从我的浏览器右键点击并保存图像,事实上,我可以通过浮动在那里的decaptcha API之一对其进行解码。但是我对scrapy非常陌生,所以我需要一些帮助来了解如何提取图像并处理它 可能需要一些帮助:)您
可能需要一些帮助:)您应该使用类似xpath的方法提取验证码图像 选择(“//div[@class='captcha']/img[@src]”) 然后处理它 上面是HtmlXPathSelector的示例,您也可以使用其他的 有关详细信息“询问代码的问题必须表明对正在解决的问题的最低理解。包括尝试的解决方案、为什么不起作用以及预期的结果。”