Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/288.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 修改现有的刮擦蜘蛛网站实施了验证码-如何获得一个图像,弹出解码和继续?_Python_Scrapy_Captcha_Web Crawler - Fatal编程技术网

Python 修改现有的刮擦蜘蛛网站实施了验证码-如何获得一个图像,弹出解码和继续?

Python 修改现有的刮擦蜘蛛网站实施了验证码-如何获得一个图像,弹出解码和继续?,python,scrapy,captcha,web-crawler,Python,Scrapy,Captcha,Web Crawler,我有一个现有的scrapy spider,它可以抓取一个公共记录站点,这个spider工作得很好,但是他们添加了一个captcha弹出窗口,破坏了这个spider(原始程序员不可用) 我试图了解如何修改现有的spider来处理这个问题 例如: 如果我点击“接受”按钮,就会弹出验证码表单 我可以从我的浏览器右键点击并保存图像,事实上,我可以通过浮动在那里的decaptcha API之一对其进行解码。但是我对scrapy非常陌生,所以我需要一些帮助来了解如何提取图像并处理它 可能需要一些帮助:)您

我有一个现有的scrapy spider,它可以抓取一个公共记录站点,这个spider工作得很好,但是他们添加了一个captcha弹出窗口,破坏了这个spider(原始程序员不可用)

我试图了解如何修改现有的spider来处理这个问题

例如:

如果我点击“接受”按钮,就会弹出验证码表单

我可以从我的浏览器右键点击并保存图像,事实上,我可以通过浮动在那里的decaptcha API之一对其进行解码。但是我对scrapy非常陌生,所以我需要一些帮助来了解如何提取图像并处理它


可能需要一些帮助:)

您应该使用类似xpath的方法提取验证码图像

选择(“//div[@class='captcha']/img[@src]”)

然后处理它

上面是HtmlXPathSelector的示例,您也可以使用其他的

有关详细信息

“询问代码的问题必须表明对正在解决的问题的最低理解。包括尝试的解决方案、为什么不起作用以及预期的结果。”