改善Android上的Tesseract结果_Android_Image Processing_Ocr_Tesseract

改善Android上的Tesseract结果

android image-processing

改善Android上的Tesseract结果,android,image-processing,ocr,tesseract,Android,Image Processing,Ocr,Tesseract,我一直在为android开发一个应用程序，它使用tesseract OCR（光学字符识别），我想知道是否有一种方法可以改善小文本的结果我曾尝试用我自己的常用词和普通词列表（使用wordlist2dawg）重新编译标准词典，但没有看到任何改进（我甚至不知道它是否有用！）。我还听说可以改变tesseract使用字典单词的阈值，但我不知道如何做到这一点如果有人知道我该如何改进tesseract给我的结果，我会非常感激我知道一些可能对您有所帮助的选项：在图像边框和文本之间添加额外的空间。如果图像

我一直在为android开发一个应用程序，它使用tesseract OCR（光学字符识别），我想知道是否有一种方法可以改善小文本的结果

我曾尝试用我自己的常用词和普通词列表（使用wordlist2dawg）重新编译标准词典，但没有看到任何改进（我甚至不知道它是否有用！）。我还听说可以改变tesseract使用字典单词的阈值，但我不知道如何做到这一点

如果有人知道我该如何改进tesseract给我的结果，我会非常感激

我知道一些可能对您有所帮助的选项：

在图像边框和文本之间添加额外的空间。如果图像中的文本位于边缘，则Tesseract的效果会很差

复制你的图像。例如，如果要对单词“foobar”执行OCR，请克隆图像并将“foobar foobar foobar foobar foobar foobar”发送到tesseract，结果会更好

谷歌为tesseract提供字体训练和图像二值化

请记住，移动设备中的内置摄像头大多会产生低质量的图像（模糊、有噪音、扭曲等）。OCR本身就是一个资源消耗过程，如果你在其中添加一个有价值的图像预处理，那么低端和中端移动设备（可能有android）可能会面临出乎意料的性能低下甚至资源不足。这对于免费的学习项目来说是可以的，但是如果你正在计划一个商业应用程序——考虑使用一个更好的SDK。

查看此问题了解详细信息：

所有好的建议。另一个建议是在实际OCR之前“修复”小文本问题。图像可以在x和y方向（成比例）增加或拉伸2倍或3倍，以生成更大的图像和更大的文本，许多OCR引擎可以更好地阅读。它需要使用一些可以“创建”新像素的图像库，而不是jsut覆盖图像标题中的dpi，但这是相对简单的预处理。