Tesseract 利用低分辨率图像提高单字符识别精度

Tesseract 利用低分辨率图像提高单字符识别精度,tesseract,python-tesseract,Tesseract,Python Tesseract,我有一组大小相同的图像,其中包含一个字符,每次大致处于相同的位置。这些图像均为80x75像素,背景为纯白色,字符为纯黑色 以下是我的一些图片示例: 到目前为止,我使用这种配置(单字符模式和字符白名单)的准确性非常差: 任何帮助都会很好,谢谢 编辑:我尝试过将图像调整为更大的尺寸,比如800 x 750,但仍然存在相同的问题。这些角色被认为是: c->p f->l j->l k->g t->l v->y x->m y->y 为什么使用.png图像而不是.jpg?如果你能得到dpi,那么试试--

我有一组大小相同的图像,其中包含一个字符,每次大致处于相同的位置。这些图像均为80x75像素,背景为纯白色,字符为纯黑色

以下是我的一些图片示例:

到目前为止,我使用这种配置(单字符模式和字符白名单)的准确性非常差:

任何帮助都会很好,谢谢

编辑:我尝试过将图像调整为更大的尺寸,比如800 x 750,但仍然存在相同的问题。这些角色被认为是:

  • c->p
  • f->l
  • j->l
  • k->g
  • t->l
  • v->y
  • x->m
  • y->y

为什么使用.png图像而不是.jpg?如果你能得到dpi,那么试试--dpi nn。此外,我还希望单个字符比字符串更难进行ocr,即使使用--psm 10也是如此。您为什么要使用.png图像而不是.jpg?如果你能得到dpi,那么试试--dpi nn。此外,我还希望单个字符比字符串更难进行ocr,即使使用--psm 10。
pytesseract.image_to_string(x, config="-c tessedit
_char_whitelist=abcdefghijklmnopqrstuvwxyz
--psm 10
-l osd
")