Python 从comlex验证码中提取文本

Python 从comlex验证码中提取文本,python,captcha,decode,tesseract,noise,Python,Captcha,Decode,Tesseract,Noise,我需要破译这种验证码。 使用ImageFilter稍作修改后,ImageEnhance如下所示 但这一点还远远没有被Tesseract认识到 问题是,验证码不是静态的,因此所有的噪音和内容都会发生变化 我想知道是否有更复杂的方法从中提取白色文本。更通用的方法。您可以绕过验证码,而不是试图破坏验证码。mitmproxy可以过滤和修改请求,这样您就不会收到需要填写验证码的页面 您可以简单地编写一个小的预处理程序,对像素进行迭代,如果像素接近白色,则将其变为黑色,如果像素不接近白色,则将其变为白色。

我需要破译这种验证码。

使用ImageFilter稍作修改后,ImageEnhance如下所示

但这一点还远远没有被Tesseract认识到

问题是,验证码不是静态的,因此所有的噪音和内容都会发生变化


我想知道是否有更复杂的方法从中提取白色文本。更通用的方法。

您可以绕过验证码,而不是试图破坏验证码。mitmproxy可以过滤和修改请求,这样您就不会收到需要填写验证码的页面

您可以简单地编写一个小的预处理程序,对像素进行迭代,如果像素接近白色,则将其变为黑色,如果像素不接近白色,则将其变为白色。这应该是直截了当的。