Python PyteSeract OCR错误文本识别_Python_Ocr_Python Tesseract

Python PyteSeract OCR错误文本识别

python

Python PyteSeract OCR错误文本识别,python,ocr,python-tesseract,Python,Ocr,Python Tesseract,当我使用PyteSeract识别此图像中的文本时，PyteSeract返回7A51k，但此图像中的文本是7451K 我如何用代码解决这个问题，而不是提供更清晰的源图像我的代码 import pytesseract as pytesseract from PIL import Image pytesseract.pytesseract.tesseract_cmd = 'D:\\App\\Tesseract-OCR\\tesseract' img = Image.open("captu

当我使用PyteSeract识别此图像中的文本时，PyteSeract返回7A51k，但此图像中的文本是7451K

我如何用代码解决这个问题，而不是提供更清晰的源图像

我的代码

import pytesseract as pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = 'D:\\App\\Tesseract-OCR\\tesseract'

img = Image.open("captured\\amount.png")
string = pytesseract.image_to_string(image=img, config="--psm 10")

print(string)

如果图像在调整大小后变得模糊，则没有问题，您可以对其设置阈值，并按照建议将其反转：

产量：7451K

将numpy作为np导入导入pytesseract 进口cv2 读取图像灰色=cv2.imread'2.png'，0 调整大小灰色=cv2.resizegray，600200 倒置灰色=255-灰色 emp=np.full_likegray，255 emp-=灰色阈值 emp[emp==0]=255

emp[emp如果图像在调整大小后变得模糊，则没有问题，您可以对其设置阈值，并按照建议进行反转：

产量：7451K

emp[emp我有一个两步解决方案

调整图像大小应用阈值。调整图像大小输入图像太小，无法识别数字、标点符号和字符。增加尺寸将能够获得准确的解决方案。申请阈值化将显示图像的特征

应用阈值时，结果将为：

读取阈值图像时：

7451K 代码：

进口cv2 从PyteSeract导入图像到字符串 img=cv2.imread4ARXO.png h、 w=图像形状[：2] img=cv2.resizeimg，w*3，h*3 gry=cv2.CVT色度，cv2.COLOR_bGR2灰色 thr=cv2.thresholdgry，0，255，cv2.threshold\u BINARY\u INV+cv2.threshold\u OTSU[1] txt=图像到字符串打印文本

我有一个两步解决方案

应用阈值时，结果将为：

读取阈值图像时：

7451K 代码：

有时OCR找不到文本。但在某些情况下，通过一些小技巧可以提高成功率。最广为人知的技巧之一就是简单地调整图像大小。你可以尝试一下：但是图像太小，所以当我调整大小时，它会变得模糊。你可以尝试反转图像。有时OCR找不到文本。但在某些情况下，你可以尝试通过几个小技巧可以提高成功率。最著名的技巧之一就是简单地调整图像大小。您可以尝试：但图像太小，因此当我调整其大小时，它会变得模糊。您可以尝试反转图像。