Android tesseract OCR改善结果

Android tesseract OCR改善结果,android,performance,image-processing,ocr,tesseract,Android,Performance,Image Processing,Ocr,Tesseract,我在android应用程序中使用OCR 我正在使用默认的照相机应用程序拍照并将相同的图像传送到tesseract库。我目前正在使用样本项目。当我处理任何图像时,我会得到不准确的结果以及许多随机的单个字母。我读了很多帖子,发现我需要对自己拍的照片进行一些预处理,所以请帮我做这个。任何关于图像处理的详细解释都将非常有用 谢谢 通过应用阈值过滤器,我得到了一个非常好的结果(85%) 注意,您的输入图像并不是最好的 它是模糊的 似乎有来自页面背面的文本通过 这一页有一个角度 如果您可以确保页面是正面

我在android应用程序中使用OCR

我正在使用默认的照相机应用程序拍照并将相同的图像传送到tesseract库。我目前正在使用样本项目。当我处理任何图像时,我会得到不准确的结果以及许多随机的单个字母。我读了很多帖子,发现我需要对自己拍的照片进行一些预处理,所以请帮我做这个。任何关于图像处理的详细解释都将非常有用

谢谢


通过应用阈值过滤器,我得到了一个非常好的结果(85%)

注意,您的输入图像并不是最好的

  • 它是模糊的
  • 似乎有来自页面背面的文本通过
  • 这一页有一个角度
如果您可以确保页面是正面的,没有文本从页面下方流出,并且图像是聚焦的,那么您应该在使用OpenCV进行Tesseract之前应用Otsu或自适应阈值。我经常执行自己的阈值处理比将其留给Tesseract处理效果更好


需要样本图像。我想将其用于从书籍中拍摄的任何类型的照片,但我仍将提供样本图像。此图片可能存在两个问题:1)JPEG压缩严重损坏(是否用于OCR?);2) 它看起来不太清晰,我怀疑是运动模糊(但很难分辨,因为1)。这种字体(时代?)经不起这种降级,因为某些地方的笔划很薄。解决运动模糊的最佳方法是:牢牢握住相机。在处理之前,是否有任何技术可以提高图像质量,可能是使用opencv。我想要非常准确的结果,我不在乎处理时间。是的,有去模糊技术。我不相信他们真的能拯救这样的形象(个人观点)。我确实认为,你应该花一些努力来获得好的图像。我允许用户从相机上拍摄图像,我如何才能施加这样的限制。你真的不能-你需要教育你的用户,作为入职过程的一部分。对于模糊度,提供点击对焦;对于非出血性,提供矩形覆盖,用户必须在其中框定文本,以便您可以强制执行边距并防止角度-您需要发挥创意,帮助用户正确地获取原始输入。