Image processing 基于ImageMagick的OCR图像预处理
在将图像发送给tesseract之前,我正在尝试找到使用ImageMagick清理图像的最佳方法 到目前为止,最好的结果是这种组合Image processing 基于ImageMagick的OCR图像预处理,image-processing,imagemagick,ocr,tesseract,imagemagick-convert,Image Processing,Imagemagick,Ocr,Tesseract,Imagemagick Convert,在将图像发送给tesseract之前,我正在尝试找到使用ImageMagick清理图像的最佳方法 到目前为止,最好的结果是这种组合 convert test.tif -fill black -fuzz 30% +opaque "#FFFFFF" result.tif 这是结果图像 它看起来不错,但我需要它变得更好,因为tesseract仍然不能产生最好的效果 我怎样才能改进它 这就是我正在处理的图像的外观。 [] [] 以下是原始tif图像。 ! 转换test.tif-否定-阈值100-否定
convert test.tif -fill black -fuzz 30% +opaque "#FFFFFF" result.tif
这是结果图像
它看起来不错,但我需要它变得更好,因为tesseract仍然不能产生最好的效果
我怎样才能改进它
这就是我正在处理的图像的外观。
[]
[]
以下是原始tif图像。
! 转换test.tif-否定-阈值100-否定结果.tif
根据需要将阈值更改为高或低。希望它对我有帮助对我来说效果很好,我得到了
238,Y=514
您使用的是哪个版本的tesseract?3或4?我正在使用3,但将尝试4,因为它使用深度学习。“我如何改进它?”尽可能减少颜色深度(1比特单色)。