Opencv 改进OCR预处理的步骤_Opencv_Ocr_Tesseract_Preprocessor

Opencv 改进OCR预处理的步骤

opencv

Opencv 改进OCR预处理的步骤,opencv,ocr,tesseract,preprocessor,Opencv,Ocr,Tesseract,Preprocessor,花了半天的时间试图找到对Tesseract OCR图像进行预处理的最佳方法，但除了阈值化之外，没有找到任何好的结果。有人能建议我应该尝试什么样的步骤吗？OpenCV、ImageMagick、Gimp对我来说是不错的工具，图像可以有不同的背景，但字体和颜色总是一样的。以下是图像示例：我现在使用的是阈值过滤器：来自OCR的文本是这样的：“消除生命线220，Vv a.-”我发现了一篇很好的文章，描述了很多预处理步骤但最好的方法是使用“Top hat形态学操作”——使用邻域像素进行操作。这

花了半天的时间试图找到对Tesseract OCR图像进行预处理的最佳方法，但除了阈值化之外，没有找到任何好的结果。有人能建议我应该尝试什么样的步骤吗？OpenCV、ImageMagick、Gimp对我来说是不错的工具，图像可以有不同的背景，但字体和颜色总是一样的。以下是图像示例：

我现在使用的是阈值过滤器：

来自OCR的文本是这样的：“消除生命线220，Vv a.-”

我发现了一篇很好的文章，描述了很多预处理步骤

但最好的方法是使用“Top hat形态学操作”——使用邻域像素进行操作。这可以使用OpenCV来完成

tophat=cv2.morphologyEx（灰色，cv2.MORPH\u tophat，矩形内核）

或者可以使用ImageMagick来完成。显示您尝试过的内容（和代码）的结果很好。这样，人们可以看到您是否遗漏了一些内容，并可以帮助添加我的输出作为示例