Opencv 一种用于语义切分的热标记方法_Opencv_Computer Vision_Tensorflow_Deep Learning_Caffe

Opencv 一种用于语义切分的热标记方法

opencv computer-vision tensorflow deep-learning

Opencv 一种用于语义切分的热标记方法,opencv,computer-vision,tensorflow,deep-learning,caffe,Opencv,Computer Vision,Tensorflow,Deep Learning,Caffe,在阅读语义分割论文时，有时我可以像读面具图像的热标签一样阅读这个术语。我不清楚这到底是什么意思？在阅读一些实现时，我可以看到它们的形状通常是rows*columns*2 我猜一个通道对应于前景，另一个对应于背景。是这样吗？此外，我如何知道哪一个是前景？如果现有训练集的形状仅为行*列*1。如何将其转换为这种格式，即行*columns*2？我所做的只是使用newimage[：，：，：，0]=original\u image和newimage[：，：，1]=1-original\u image。但我不

在阅读语义分割论文时，有时我可以像读面具图像的热标签一样阅读这个术语。我不清楚这到底是什么意思？在阅读一些实现时，我可以看到它们的形状通常是

rows*columns*2

我猜一个通道对应于前景，另一个对应于背景。是这样吗？此外，我如何知道哪一个是前景？如果现有训练集的形状仅为

行*列*1

。如何将其转换为这种格式，即

行*columns*2

？我所做的只是使用

newimage[：，：，：，0]=original\u image

和

newimage[：，：，1]=1-original\u image

。但我不确定它是否正确？

像1、2、3、4、5等分类标签没有任何自然顺序。所以使用这些数字可能意味着标签5比标签1大，但冰箱和狗只是两个标签，没有自然顺序

我们把标签1,2,3,4,5转换成

[1,0,0,0,0]，[0,1,0,0,0]，…，[0,0,0,0,1]

所以现在它们只是指向某个方向的向量，这使得逻辑回归和其他损失函数更容易处理

您还可以使用行*列*1对前景背景进行编码

只需将前景值设置为1，将背景值设置为0，即可获得前景背景遮罩

我需要看一个什么时候使用行*列*2的例子，因为这个例子并不常见，而且可能会根据您看到它的位置而有所不同。

就像在这篇u-net论文中一样，他们使用了两个输出通道，在第4页底部的那张纸上，通过softmax激活和日志丢失，他们为每个类使用前景/背景掩码和分类标签，如第5页顶部所述。这就是为什么我相信他们有两个输出面具。