Java 交错边界盒问题

Java 交错边界盒问题,java,tesseract,image-segmentation,bounding-box,Java,Tesseract,Image Segmentation,Bounding Box,我的程序解析一行文本。在下图中,我在每个字符周围绘制了来自Tesseract结果迭代器的边界框: 显然,Tesseract在分割行中的最后一个字符(“5”)时存在一些问题,检测到3个边界框。 最后一个字符实际上比其他字符大一点,但当像素块的阈值设置得如此清晰时,为什么Tesseract分割该字符的方式会如此不同呢 我已经设置了这些Tesseract变量: tess.setVariable("save_blob_choices", "1"); tess.setPageSegMode(PageSe

我的程序解析一行文本。在下图中,我在每个字符周围绘制了来自Tesseract结果迭代器的边界框:

显然,Tesseract在分割行中的最后一个字符(“5”)时存在一些问题,检测到3个边界框。 最后一个字符实际上比其他字符大一点,但当像素块的阈值设置得如此清晰时,为什么Tesseract分割该字符的方式会如此不同呢

我已经设置了这些Tesseract变量:

tess.setVariable("save_blob_choices", "1");
tess.setPageSegMode(PageSegMode.PSM_SINGLE_LINE);
tess.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "0123456789"
and textord_min_xheight set to the pixel height of the above image

有什么建议吗?

我没有找到解决这个问题的办法。Tesseract的文档记录非常糟糕


我最终找到了每个字符的轮廓,然后使用页面分割模式PSM_符号将字符的每个子图像传递给Tesseract。最后,这也是前一种方法的两倍

我没有找到解决这个问题的办法。Tesseract的文档记录非常糟糕

我最终找到了每个字符的轮廓,然后使用页面分割模式PSM_符号将字符的每个子图像传递给Tesseract。最后,这也是前一种方法的两倍