Graph 计算机视觉:分割设置。图割势

Graph 计算机视觉:分割设置。图割势,graph,computer-vision,image-segmentation,max-flow,Graph,Computer Vision,Image Segmentation,Max Flow,我一直在努力教自己一些简单的计算机视觉算法,并试图解决一个问题,我有一些噪声破坏的图像,所有我试图做的是分离黑色背景和前景,其中有一些信号。现在,背景RGB通道并非全部为零,因为它们可能有一些噪声。然而,人眼可以很容易地从背景中辨别前景 所以,我所做的是使用SLIC算法将图像分解为超级像素。其想法是,由于图像受到噪声的破坏,因此,由于较高的信噪比,对斑块进行统计可能会导致更好的背景和前景分类 在这之后,我得到了大约100个补丁,它们应该具有相似的轮廓,SLIC的结果似乎是合理的。我一直在读关于图

我一直在努力教自己一些简单的计算机视觉算法,并试图解决一个问题,我有一些噪声破坏的图像,所有我试图做的是分离黑色背景和前景,其中有一些信号。现在,背景RGB通道并非全部为零,因为它们可能有一些噪声。然而,人眼可以很容易地从背景中辨别前景

所以,我所做的是使用SLIC算法将图像分解为超级像素。其想法是,由于图像受到噪声的破坏,因此,由于较高的信噪比,对斑块进行统计可能会导致更好的背景和前景分类

在这之后,我得到了大约100个补丁,它们应该具有相似的轮廓,SLIC的结果似乎是合理的。我一直在读关于图切割(Kolmogorov论文)的书,对于我所遇到的二进制问题,尝试一下似乎是件好事。因此,我构造了一个图,它是一阶MRF,并且在近邻之间有边(4-连通图)

现在,我想知道我可以在这里使用什么样的一元和二元术语来进行分割。所以,我在考虑一元项,我可以把它建模为一个简单的高斯分布,背景应该是零平均强度,前景应该是非零平均强度。尽管如此,我仍在努力找出如何对其进行编码。我是否应该假设一些噪声方差并直接使用面片统计计算概率

类似地,对于相邻的补丁,我确实希望鼓励他们使用类似的标签,但我不确定我可以设计什么二进制术语来反映这一点。似乎只是标签(1或0)之间的差异看起来很奇怪

对不起,这个冗长的问题。希望有人能给出一些关于如何开始的有用提示。

你可以在超级像素上构建模型,这样一个超级像素就可以连接到另一个超级像素(如果它是超级像素的邻居)

因为你的统计模型简单,计算成本低

因此,对于CRF的一元术语,我建议如下:

  • 在每个像素的纹理上构建前景和背景直方图(假设您有一个遮罩,或者有合理数量的标记前景像素(注意,不是超级像素))
  • 对于每个超级像素,对其中的像素进行独立假设,这样超级像素成为前景或背景的可能性是超级像素中每个观察值的乘积(实际上,我们求和日志)。单个似然项来自您生成的直方图
  • 将前景的后验概率计算为上述前景的累积似然度除以两者的累积似然度之和。背景相似
  • 超级像素之间的成对项可以很简单,就像通过内核的每个纹理的平均观察纹理(像素方向)之间的差异一样,例如


    或者,您可以计算观察到的每个超级像素纹理的直方图(同样,像素级),并计算每个相邻的超级像素对之间的直方图。

    一个好的起点是Yuri Boykov的日志论文:您可以查看我在旧网站上找到的多标签。非常感谢Shai!你的网站给了我很多想法去尝试。再次感谢!