Image processing 计算论文中学习词汇的总数[图像处理]

Image processing 计算论文中学习词汇的总数[图像处理],image-processing,image-segmentation,feature-detection,feature-extraction,object-detection,Image Processing,Image Segmentation,Feature Detection,Feature Extraction,Object Detection,我在做一个DIP项目。我想用图像处理来计算每篇论文的总字数 原始图像为: 我做了一些预处理,生成了下图: 我计算每篇论文的总字数的想法是检测blob中的数字 所以请引导我。我如何计算这个图像中的单词?你的想法是什么 谢谢。使用斑点/圆圈内的数字是一个很好的问题定义。我建议您执行圆hough变换,只查找特定半径的圆,然后计算检测到的圆数。你必须计算出你的半径是多少像素,但这可能是一个很好的起点。祝你好运如果所有页面都有一个清晰的分隔,每行定义一个,那么你可以采用一种非常简单的方法来计算填充的行

我在做一个DIP项目。我想用图像处理来计算每篇论文的总字数

原始图像为:

我做了一些预处理,生成了下图:

我计算每篇论文的总字数的想法是检测blob中的数字

所以请引导我。我如何计算这个图像中的单词?你的想法是什么


谢谢。

使用斑点/圆圈内的数字是一个很好的问题定义。我建议您执行圆hough变换,只查找特定半径的圆,然后计算检测到的圆数。你必须计算出你的半径是多少像素,但这可能是一个很好的起点。祝你好运

如果所有页面都有一个清晰的分隔,每行定义一个,那么你可以采用一种非常简单的方法来计算填充的行数。首先检测页面上的列表以忽略不相关的标记(绿色框)-不必精确检测边缘,只要边界不大于列表

然后查找没有标记的像素水平线,或者没有大于X暗度的暗值。下面用粉红色的水平线来说明这一点。最后数一数填充的行(水平线的任何不为空的离散部分),就有了定义的数量


谢谢你,亲爱的安德鲁,我会尽力实现你的想法。如果我做不到,我会请你提供更多指导。没有源代码。这只是一个模型来说明我的观点