Python Tesseract OCR无法识别数字7

Python Tesseract OCR无法识别数字7,python,ocr,tesseract,python-tesseract,Python,Ocr,Tesseract,Python Tesseract,我试图分析一个包含两个数字的png图像。Tesseract似乎在检测此图像中的数字7(七)时遇到问题。它将其识别为1(1) 我的配置是: config='--oem 1 --psm 7 tessedit_char_whitelist=0123456789' tesseract——版本返回以下内容 tesseract 4.0.0 leptonica-1.76.0 libgif 5.1.4 : libjpeg 6b (libjpeg-turbo 1.5.2) : libpng 1.6.36 : l

我试图分析一个包含两个数字的png图像。Tesseract似乎在检测此图像中的数字7(七)时遇到问题。它将其识别为1(1)

我的配置是:

config='--oem 1 --psm 7 tessedit_char_whitelist=0123456789'
tesseract——版本返回以下内容

tesseract 4.0.0
leptonica-1.76.0
libgif 5.1.4 : libjpeg 6b (libjpeg-turbo 1.5.2) : libpng 1.6.36 : libtiff 4.1.0 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
我使用了oem和psm值,结果没有变化。任何帮助都将不胜感激


图像中的字符太大,我想tesseract没有接受过这方面的培训

调整图像大小效果很好

tesseract cnLRQ.png stdout --oem 1 --psm 7 --dpi 70 digits
18
convert -resize 10% cnLRQ.png cnLRQ-small.png
tesseract cnLRQ-small.png stdout --oem 1 --psm 7 --dpi 70 digits
78

非常感谢。你的建议适用于这个具体的例子,但仍然不适用于我所有的例子。不过我现在知道我也需要考虑尺寸和dpi。再次感谢!