Python 为什么使用pytesseract从图像中读取文本不起作用?

Python 为什么使用pytesseract从图像中读取文本不起作用?,python,python-tesseract,image-text,Python,Python Tesseract,Image Text,这是我的密码: 导入pytesseract pytesseract.pytesseract.tesseract\u cmd=r'F:\Installations\tesseract' 打印(pytesseract.image\u到字符串('images/meme1.png',lang='eng')) 下面是图片: 输出如下: GP. ed <a = va ay Roce Thee . ‘ , Pe ship RCAC Tm alesy-3 Pein Reg a years

这是我的密码:

导入pytesseract
pytesseract.pytesseract.tesseract\u cmd=r'F:\Installations\tesseract'
打印(pytesseract.image\u到字符串('images/meme1.png',lang='eng'))
下面是图片:

输出如下:

GP.
ed <a

= va
ay Roce Thee .
‘ , Pe ship
   
RCAC Tm alesy-3

Pein Reg a

years —
? >
ee bs
GP。
预计起飞时间
ee bs

我在输出中看到单词years,所以它确实能识别文本,但为什么不能完全识别呢?

在杂乱的场景中,OCR仍然是一个非常困难的问题。如果不对图像进行预处理,可能无法获得更好的结果。在这种特定情况下,首先对图像设置阈值是有意义的,仅提取白色区域(即文本)。您可以在opencv中查找以下内容:

此外,在您的图像中,任意位置只有两行文本,因此使用页面分割模式可能有意义: