Image 文档图像字符斑识别中最大稳定极值区域的实现

Image 文档图像字符斑识别中最大稳定极值区域的实现,image,image-processing,blob,signal-processing,mser,Image,Image Processing,Blob,Signal Processing,Mser,我的任务是识别文档图像中的字符补丁。考虑下面的图像: 基于此,为了提取字符块,将采用基于MSER的方法来检测候选字符 “基于MSER的方法的主要优点是,这种算法是 即使在文档图像处于打开状态时,也能找到最清晰的字符 低质量。” 另一个讨论了MSER。我很难理解后一篇论文。有谁能简单地向我解释一下我应该采取哪些步骤来实现MSER,并在示例文档中提取字符补丁。我将用Python实现它,我需要完全掌握/理解MSER是如何工作的 以下是识别图像文档中字符补丁的步骤(根据我的理解,如果我错了,请纠正我)

我的任务是识别文档图像中的字符补丁。考虑下面的图像:

基于此,为了提取字符块,将采用基于MSER的方法来检测候选字符

“基于MSER的方法的主要优点是,这种算法是 即使在文档图像处于打开状态时,也能找到最清晰的字符 低质量。”

另一个讨论了MSER。我很难理解后一篇论文。有谁能简单地向我解释一下我应该采取哪些步骤来实现
MSER
,并在示例文档中提取字符补丁。我将用Python实现它,我需要完全掌握/理解MSER是如何工作的

以下是识别图像文档中字符补丁的步骤(根据我的理解,如果我错了,请纠正我)

  • 首先,像素按强度排序

    我的理解是:

    例如,我在一幅图像中有5个像素,其强度连续
    (像素1)1,(像素2)9,(像素3)255,(像素4)3,(像素5)4
    ,如果根据强度进行递增排序,它将产生一个输出,
    像素1,4,5,2和3

  • 排序后,将像素放置在图像中(按降序或升序),并使用高效的联合查找算法维护连接组件及其区域的列表

    我的理解是:

    使用数字1中的示例。像素的排列如下所示。像素组件/组和图像X、Y坐标只是示例

     Pixel Number | Intensity Level | Pixel Component/Group | Image X,Y Coordinates
          1       |        1        |  Pixel Component # 5 | (14,12)
          4       |        3        |  Pixel Component # 1 | (234,213)
          5       |        4        |  Pixel Component # 2 | (231,14)
          2       |        9        |  Pixel Component # 3 | (23,21)
          3       |      255        |  Pixel Component # 1 | (234,214)
    
  • “该过程生成一个数据结构,将每个连接部件的面积存储为强度的函数。”

    我的理解是:

    将在#2中的表中添加一列,称为
    区域
    。它将计算具有相同强度级别的特定组件中的像素数。它类似于组件组中具有相同强度级别的像素的聚合

    4.“最后,选择面积函数变化率的局部最小强度水平作为产生MSER的阈值。在输出中,每个MSER由局部强度最小值(或最大值)和阈值的位置表示。”

  • 如何求面积函数变化率的局部极小值

    请帮助我理解这是什么以及如何实现MSER。请随意更正我的理解。谢谢。

    在其中一个例子中,作者跟踪一个他们称之为“稳定性”的值(这大致意味着在他们的数据结构中从一个区域到另一个区域的面积变化率),然后找到与该值的局部极小值相对应的区域(局部极小值是指感兴趣的值小于最近邻居的值的点). 如果有任何帮助,是一个C++实现的MSER(基于另一篇文章)。