Image processing 什么是图像分割中的不平衡?

Image processing 什么是图像分割中的不平衡?,image-processing,machine-learning,keras,caffe,image-segmentation,Image Processing,Machine Learning,Keras,Caffe,Image Segmentation,我知道,如果有太多的猫图像和太少的狗图像,图像分类问题(如猫对狗分类)中存在不平衡。但我不知道如何解决细分问题中的不平衡 例如,我的任务是从卫星图像中屏蔽云层,因此我将问题转化为两类分割,一类是云,另一类是背景。数据集有5800个4波段16位图像,大小为256*256。其结构为Segnet,损失函数为二进制交叉熵 假设有两种情况: 一半的样品完全被云层覆盖,一半没有云层 在每幅图像中,一半被云层覆盖,一半没有 所以,我想案例2是平衡的,但是案例1呢 实际上,在我的任务中,这两种情况在源卫星图像中

我知道,如果有太多的猫图像和太少的狗图像,图像分类问题(如猫对狗分类)中存在不平衡。但我不知道如何解决细分问题中的不平衡

例如,我的任务是从卫星图像中屏蔽云层,因此我将问题转化为两类分割,一类是云,另一类是背景。数据集有5800个4波段16位图像,大小为256*256。其结构为Segnet,损失函数为二进制交叉熵

假设有两种情况:

  • 一半的样品完全被云层覆盖,一半没有云层
  • 在每幅图像中,一半被云层覆盖,一半没有
  • 所以,我想案例2是平衡的,但是案例1呢

    实际上,在我的任务中,这两种情况在源卫星图像中是不可能的,因为相对于背景而言,云量总是相对较小的,但是如果图像样本因其较大而从源图像中裁剪,则会出现一些新的情况

    因此,样本始终包含三种类型的图像:

  • 完全被云层覆盖(5800个样本中有254个)
  • 无任何云(5800个样本中有1241个)
  • 有些地区被云层覆盖,有些地区没有。(5800中的4305,但我不知道云的百分比,在某些样本中可能非常高,在其他样本中可能很少)
  • 我的问题:

    样品是否不平衡?我该怎么办


    提前感谢。

    通常,在分割任务中,如果每个图像属于每个类/段的像素数大致相同(您的问题中的情况2),则认为他/她的样本是“平衡的”。
    在大多数情况下,样本永远不会平衡,如您的示例中所示

    会出现什么问题?当有一个段/类支配样本时,模型可能会发现更容易输出属于主导类/段的所有像素。这种持续的预测虽然没有提供信息,但仍然可以产生高精度和小损失

    如何检测这种错误结果?您可以使
    的“精度”
    层输出的不仅是整体精度,还有精度。如果您的模型“锁定”在单个类上,则所有其他类的每类精度都将非常低


    我能做些什么?您可以使用图层为其他类的错误赋予更多权重,以抵消主导类的影响。

    感谢您的更正和回复。我将在caffe中尝试“InfogainLoss”层。谁知道如何像caffe在keras中那样输出每类的精度?