Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/android/229.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/image-processing/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
改善Android上的Tesseract结果_Android_Image Processing_Ocr_Tesseract - Fatal编程技术网

改善Android上的Tesseract结果

改善Android上的Tesseract结果,android,image-processing,ocr,tesseract,Android,Image Processing,Ocr,Tesseract,我一直在为android开发一个应用程序,它使用tesseract OCR(光学字符识别),我想知道是否有一种方法可以改善小文本的结果 我曾尝试用我自己的常用词和普通词列表(使用wordlist2dawg)重新编译标准词典,但没有看到任何改进(我甚至不知道它是否有用!)。我还听说可以改变tesseract使用字典单词的阈值,但我不知道如何做到这一点 如果有人知道我该如何改进tesseract给我的结果,我会非常感激 我知道一些可能对您有所帮助的选项: 在图像边框和文本之间添加额外的空间。如果图像

我一直在为android开发一个应用程序,它使用tesseract OCR(光学字符识别),我想知道是否有一种方法可以改善小文本的结果

我曾尝试用我自己的常用词和普通词列表(使用wordlist2dawg)重新编译标准词典,但没有看到任何改进(我甚至不知道它是否有用!)。我还听说可以改变tesseract使用字典单词的阈值,但我不知道如何做到这一点


如果有人知道我该如何改进tesseract给我的结果,我会非常感激

我知道一些可能对您有所帮助的选项:

  • 在图像边框和文本之间添加额外的空间。如果图像中的文本位于边缘,则Tesseract的效果会很差
  • 复制你的图像。例如,如果要对单词“foobar”执行OCR,请克隆图像并将“foobar foobar foobar foobar foobar foobar”发送到tesseract,结果会更好
  • 谷歌为tesseract提供字体训练和图像二值化
  • 请记住,移动设备中的内置摄像头大多会产生低质量的图像(模糊、有噪音、扭曲等)。OCR本身就是一个资源消耗过程,如果你在其中添加一个有价值的图像预处理,那么低端和中端移动设备(可能有android)可能会面临出乎意料的性能低下甚至资源不足。这对于免费的学习项目来说是可以的,但是如果你正在计划一个商业应用程序——考虑使用一个更好的SDK。
    查看此问题了解详细信息:

    所有好的建议。另一个建议是在实际OCR之前“修复”小文本问题。图像可以在x和y方向(成比例)增加或拉伸2倍或3倍,以生成更大的图像和更大的文本,许多OCR引擎可以更好地阅读。它需要使用一些可以“创建”新像素的图像库,而不是jsut覆盖图像标题中的dpi,但这是相对简单的预处理。