Java 提高扫描图像的分割效果

Java 提高扫描图像的分割效果,java,image-processing,ocr,tesseract,tess4j,Java,Image Processing,Ocr,Tesseract,Tess4j,我有一个经过处理的扫描图像,我正试图对其执行OCR。该图像在转换为二进制并缩放后看起来像是一幅图像,但是Tesseract无法检索出与其他图像不同的字母数字 预期结果是“123112”,但我得到了类似“*53”的jibberish;。gxuimSaabz'ssiiämFi??? 1231 12 5 *". Tessaract通过JNI实例化如下(在Java 8中实现): 你知道如何改进结果吗?看起来你的数字是正确的“1231 12”“因此,可能是因为噪音的原因,它将最上面的字母解析为胡言乱语

我有一个经过处理的扫描图像,我正试图对其执行OCR。该图像在转换为二进制并缩放后看起来像是一幅图像,但是Tesseract无法检索出与其他图像不同的字母数字

预期结果是“123112”,但我得到了类似“*53”的jibberish;。gxuimSaabz'ssiiämFi??? 1231 12 5 *". Tessaract通过JNI实例化如下(在Java 8中实现):


你知道如何改进结果吗?

看起来你的数字是正确的“1231 12”“因此,可能是因为噪音的原因,它将最上面的字母解析为胡言乱语。试着告诉Tesseract只匹配数字,或者试着通过先进行腐蚀,然后进行放大以去除小的单个像素来降低噪声。是的,我的预期数字确实显示出来了,但结果是非常不可预测的,因为它会不时地变化。我会尝试进一步降低噪音,谢谢你的提示!
            instance = new Tesseract();  // JNA Interface Mapping
            instance.setLanguage("swe");
            instance.setOcrEngineMode(ITessAPI.TessOcrEngineMode.OEM_TESSERACT_ONLY);