Python PyteSeract OCR错误文本识别

Python PyteSeract OCR错误文本识别,python,ocr,python-tesseract,Python,Ocr,Python Tesseract,当我使用PyteSeract识别此图像中的文本时,PyteSeract返回7A51k,但此图像中的文本是7451K 我如何用代码解决这个问题,而不是提供更清晰的源图像 我的代码 import pytesseract as pytesseract from PIL import Image pytesseract.pytesseract.tesseract_cmd = 'D:\\App\\Tesseract-OCR\\tesseract' img = Image.open("captu

当我使用PyteSeract识别此图像中的文本时,PyteSeract返回7A51k,但此图像中的文本是7451K

我如何用代码解决这个问题,而不是提供更清晰的源图像

我的代码

import pytesseract as pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = 'D:\\App\\Tesseract-OCR\\tesseract'

img = Image.open("captured\\amount.png")
string = pytesseract.image_to_string(image=img, config="--psm 10")

print(string)

如果图像在调整大小后变得模糊,则没有问题,您可以对其设置阈值,并按照建议将其反转:

产量:7451K

将numpy作为np导入 导入pytesseract 进口cv2 读取图像 灰色=cv2.imread'2.png',0 调整大小 灰色=cv2.resizegray,600200 倒置 灰色=255-灰色 emp=np.full_likegray,255 emp-=灰色 阈值 emp[emp==0]=255
emp[emp如果图像在调整大小后变得模糊,则没有问题,您可以对其设置阈值,并按照建议进行反转:

产量:7451K

将numpy作为np导入 导入pytesseract 进口cv2 读取图像 灰色=cv2.imread'2.png',0 调整大小 灰色=cv2.resizegray,600200 倒置 灰色=255-灰色 emp=np.full_likegray,255 emp-=灰色 阈值 emp[emp==0]=255
emp[emp我有一个两步解决方案

调整图像大小 应用阈值。 调整图像大小 输入图像太小,无法识别数字、标点符号和字符。增加尺寸将能够获得准确的解决方案。 申请 阈值化将显示图像的特征

应用阈值时,结果将为:

读取阈值图像时:

7451K 代码:

进口cv2 从PyteSeract导入图像到字符串 img=cv2.imread4ARXO.png h、 w=图像形状[:2] img=cv2.resizeimg,w*3,h*3 gry=cv2.CVT色度,cv2.COLOR_bGR2灰色 thr=cv2.thresholdgry,0,255,cv2.threshold\u BINARY\u INV+cv2.threshold\u OTSU[1] txt=图像到字符串 打印文本
我有一个两步解决方案

调整图像大小 应用阈值。 调整图像大小 输入图像太小,无法识别数字、标点符号和字符。增加尺寸将能够获得准确的解决方案。 申请 阈值化将显示图像的特征

应用阈值时,结果将为:

读取阈值图像时:

7451K 代码:

进口cv2 从PyteSeract导入图像到字符串 img=cv2.imread4ARXO.png h、 w=图像形状[:2] img=cv2.resizeimg,w*3,h*3 gry=cv2.CVT色度,cv2.COLOR_bGR2灰色 thr=cv2.thresholdgry,0,255,cv2.threshold\u BINARY\u INV+cv2.threshold\u OTSU[1] txt=图像到字符串 打印文本
有时OCR找不到文本。但在某些情况下,通过一些小技巧可以提高成功率。最广为人知的技巧之一就是简单地调整图像大小。你可以尝试一下:但是图像太小,所以当我调整大小时,它会变得模糊。你可以尝试反转图像。有时OCR找不到文本。但在某些情况下,你可以尝试通过几个小技巧可以提高成功率。最著名的技巧之一就是简单地调整图像大小。您可以尝试:但图像太小,因此当我调整其大小时,它会变得模糊。您可以尝试反转图像。