改善Android上的Tesseract结果
我一直在为android开发一个应用程序,它使用tesseract OCR(光学字符识别),我想知道是否有一种方法可以改善小文本的结果 我曾尝试用我自己的常用词和普通词列表(使用wordlist2dawg)重新编译标准词典,但没有看到任何改进(我甚至不知道它是否有用!)。我还听说可以改变tesseract使用字典单词的阈值,但我不知道如何做到这一点改善Android上的Tesseract结果,android,image-processing,ocr,tesseract,Android,Image Processing,Ocr,Tesseract,我一直在为android开发一个应用程序,它使用tesseract OCR(光学字符识别),我想知道是否有一种方法可以改善小文本的结果 我曾尝试用我自己的常用词和普通词列表(使用wordlist2dawg)重新编译标准词典,但没有看到任何改进(我甚至不知道它是否有用!)。我还听说可以改变tesseract使用字典单词的阈值,但我不知道如何做到这一点 如果有人知道我该如何改进tesseract给我的结果,我会非常感激 我知道一些可能对您有所帮助的选项: 在图像边框和文本之间添加额外的空间。如果图像
如果有人知道我该如何改进tesseract给我的结果,我会非常感激 我知道一些可能对您有所帮助的选项:
查看此问题了解详细信息:所有好的建议。另一个建议是在实际OCR之前“修复”小文本问题。图像可以在x和y方向(成比例)增加或拉伸2倍或3倍,以生成更大的图像和更大的文本,许多OCR引擎可以更好地阅读。它需要使用一些可以“创建”新像素的图像库,而不是jsut覆盖图像标题中的dpi,但这是相对简单的预处理。