Computer vision 在文档图像中查找单词的质心

Computer vision 在文档图像中查找单词的质心,computer-vision,Computer Vision,如何在文档图像中找到单词的质心?我尝试过这样做,首先模糊每个单词,以便将字符连接起来形成一个轮廓,然后在轮廓中使用平均值来找到质心。还有其他方法吗?模糊是一种很好的方法,但根据字体的不同,您可以开始模糊上面或下面一个字符串的单词。您可以考虑两个不同级别的文本元素表示,以使方法更加健壮。 您可以在处理过程中降低一个级别,获得带有字母的段。可以使用或连接组件或查找字母。监视字母之间的距离将允许您将它们连接成单词。字母的大小和单词中字母之间的距离也可以让你更好地了解单词之间可能的距离 您还可以在处理层

如何在文档图像中找到单词的质心?我尝试过这样做,首先模糊每个单词,以便将字符连接起来形成一个轮廓,然后在轮廓中使用平均值来找到质心。还有其他方法吗?

模糊是一种很好的方法,但根据字体的不同,您可以开始模糊上面或下面一个字符串的单词。您可以考虑两个不同级别的文本元素表示,以使方法更加健壮。 您可以在处理过程中降低一个级别,获得带有字母的段。可以使用或连接组件或查找字母。监视字母之间的距离将允许您将它们连接成单词。字母的大小和单词中字母之间的距离也可以让你更好地了解单词之间可能的距离


您还可以在处理层次结构中更高的级别查找字符串。然后,您可以遍历一个字符串,用字母像素的垂直扫描线生成直方图。柱状图中的穿透将指示单词边界。字符串的高度也可以与单词之间空白的长度相称。最后,与单词相比,字符串作为一个整体似乎不太依赖于字体或大写字母的特性。

您已经遵循了形心的定义。所以,你的思路是正确的。然而,你决定一个特定轮廓是否是一个单词的方式的质量取决于你的图像质量。因此,请提供一些示例图像。