Opencv 改进OCR预处理的步骤

Opencv 改进OCR预处理的步骤,opencv,ocr,tesseract,preprocessor,Opencv,Ocr,Tesseract,Preprocessor,花了半天的时间试图找到对Tesseract OCR图像进行预处理的最佳方法,但除了阈值化之外,没有找到任何好的结果。有人能建议我应该尝试什么样的步骤吗?OpenCV、ImageMagick、Gimp对我来说是不错的工具,图像可以有不同的背景,但字体和颜色总是一样的。以下是图像示例: 我现在使用的是阈值过滤器: 来自OCR的文本是这样的:“消除生命线220,Vv a.-”我发现了一篇很好的文章,描述了很多预处理步骤 但最好的方法是使用“Top hat形态学操作”——使用邻域像素进行操作。这

花了半天的时间试图找到对Tesseract OCR图像进行预处理的最佳方法,但除了阈值化之外,没有找到任何好的结果。有人能建议我应该尝试什么样的步骤吗?OpenCV、ImageMagick、Gimp对我来说是不错的工具,图像可以有不同的背景,但字体和颜色总是一样的。以下是图像示例:

  • 我现在使用的是阈值过滤器:


    来自OCR的文本是这样的:“消除生命线220,Vv a.-”

    我发现了一篇很好的文章,描述了很多预处理步骤

    但最好的方法是使用“Top hat形态学操作”——使用邻域像素进行操作。这可以使用OpenCV来完成
    tophat=cv2.morphologyEx(灰色,cv2.MORPH\u tophat,矩形内核)


    或者可以使用ImageMagick来完成。显示您尝试过的内容(和代码)的结果很好。这样,人们可以看到您是否遗漏了一些内容,并可以帮助添加我的输出作为示例