Android tesseract OCR改善结果_Android_Performance_Image Processing_Ocr_Tesseract

Android tesseract OCR改善结果

android performance image-processing

Android tesseract OCR改善结果,android,performance,image-processing,ocr,tesseract,Android,Performance,Image Processing,Ocr,Tesseract,我在android应用程序中使用OCR 我正在使用默认的照相机应用程序拍照并将相同的图像传送到tesseract库。我目前正在使用样本项目。当我处理任何图像时，我会得到不准确的结果以及许多随机的单个字母。我读了很多帖子，发现我需要对自己拍的照片进行一些预处理，所以请帮我做这个。任何关于图像处理的详细解释都将非常有用谢谢通过应用阈值过滤器，我得到了一个非常好的结果（85%）注意，您的输入图像并不是最好的它是模糊的似乎有来自页面背面的文本通过这一页有一个角度如果您可以确保页面是正面

我在android应用程序中使用OCR

我正在使用默认的照相机应用程序拍照并将相同的图像传送到tesseract库。我目前正在使用样本项目。当我处理任何图像时，我会得到不准确的结果以及许多随机的单个字母。我读了很多帖子，发现我需要对自己拍的照片进行一些预处理，所以请帮我做这个。任何关于图像处理的详细解释都将非常有用

谢谢

通过应用阈值过滤器，我得到了一个非常好的结果（85%）

注意，您的输入图像并不是最好的

它是模糊的
似乎有来自页面背面的文本通过
这一页有一个角度

如果您可以确保页面是正面的，没有文本从页面下方流出，并且图像是聚焦的，那么您应该在使用OpenCV进行Tesseract之前应用Otsu或自适应阈值。我经常执行自己的阈值处理比将其留给Tesseract处理效果更好

需要样本图像。我想将其用于从书籍中拍摄的任何类型的照片，但我仍将提供样本图像。此图片可能存在两个问题：1）JPEG压缩严重损坏（是否用于OCR？）；2）它看起来不太清晰，我怀疑是运动模糊（但很难分辨，因为1）。这种字体（时代？）经不起这种降级，因为某些地方的笔划很薄。解决运动模糊的最佳方法是：牢牢握住相机。在处理之前，是否有任何技术可以提高图像质量，可能是使用opencv。我想要非常准确的结果，我不在乎处理时间。是的，有去模糊技术。我不相信他们真的能拯救这样的形象（个人观点）。我确实认为，你应该花一些努力来获得好的图像。我允许用户从相机上拍摄图像，我如何才能施加这样的限制。你真的不能-你需要教育你的用户，作为入职过程的一部分。对于模糊度，提供点击对焦；对于非出血性，提供矩形覆盖，用户必须在其中框定文本，以便您可以强制执行边距并防止角度-您需要发挥创意，帮助用户正确地获取原始输入。