Python Tesseract无法读取图像中的数字(验证码)

Python Tesseract无法读取图像中的数字(验证码),python,python-imaging-library,captcha,cv2,python-tesseract,Python,Python Imaging Library,Captcha,Cv2,Python Tesseract,我有这样的图像: 通过下面的代码,我可以将其转换为: 图像的编号为:8276 但我的代码将其解读为776 我如何才能成功地使我的代码能够以8276的形式读取? 我对这个图像处理/cv2/Pyteseract非常陌生,经过太多的搜索,我终于走到了这一步 import cv2 import pytesseract from PIL import Image pytesseract.pytesseract.tesseract_cmd = r'C:\Users\hamza.rana\AppData\

我有这样的图像: 通过下面的代码,我可以将其转换为:

图像的编号为:8276 但我的代码将其解读为776

我如何才能成功地使我的代码能够以8276的形式读取? 我对这个图像处理/cv2/Pyteseract非常陌生,经过太多的搜索,我终于走到了这一步

import cv2
import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r'C:\Users\hamza.rana\AppData\Local\Tesseract-OCR\tesseract.exe'

image = cv2.imread('captcha.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
gray = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
gray = cv2.medianBlur(gray, 3)
gray = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
filename = "{}.png".format("temp")
cv2.imwrite(filename, gray)
text = pytesseract.image_to_string(Image.open('temp.png'),config='--psm 13 --oem 3 -c tessedit_char_whitelist=0123456789')
print(text)

关于Tesseract的开箱即用培训最适合于字体,而且(以我的经验)手工打印效果不佳,在长手稿上就忘了它

当事情变得紧张时,稍微有帮助的一点是将边界扩大几个像素。但从一个混乱的卡普查开始。。。这可能是你必须训练一个模特的原因