Opencv 一种用于语义切分的热标记方法

Opencv 一种用于语义切分的热标记方法,opencv,computer-vision,tensorflow,deep-learning,caffe,Opencv,Computer Vision,Tensorflow,Deep Learning,Caffe,在阅读语义分割论文时,有时我可以像读面具图像的热标签一样阅读这个术语。我不清楚这到底是什么意思?在阅读一些实现时,我可以看到它们的形状通常是rows*columns*2 我猜一个通道对应于前景,另一个对应于背景。是这样吗?此外,我如何知道哪一个是前景?如果现有训练集的形状仅为行*列*1。如何将其转换为这种格式,即行*columns*2?我所做的只是使用newimage[:,:,:,0]=original\u image和newimage[:,:,1]=1-original\u image。但我不

在阅读语义分割论文时,有时我可以像读面具图像的热标签一样阅读这个术语。我不清楚这到底是什么意思?在阅读一些实现时,我可以看到它们的形状通常是
rows*columns*2


我猜一个通道对应于前景,另一个对应于背景。是这样吗?此外,我如何知道哪一个是前景?如果现有训练集的形状仅为
行*列*1
。如何将其转换为这种格式,即
行*columns*2
?我所做的只是使用
newimage[:,:,:,0]=original\u image
newimage[:,:,1]=1-original\u image
。但我不确定它是否正确?

像1、2、3、4、5等分类标签没有任何自然顺序。所以使用这些数字可能意味着标签5比标签1大,但冰箱和狗只是两个标签,没有自然顺序

我们把标签1,2,3,4,5转换成

[1,0,0,0,0],[0,1,0,0,0],…,[0,0,0,0,1]

所以现在它们只是指向某个方向的向量,这使得逻辑回归和其他损失函数更容易处理

您还可以使用行*列*1对前景背景进行编码

只需将前景值设置为1,将背景值设置为0,即可获得前景背景遮罩


我需要看一个什么时候使用行*列*2的例子,因为这个例子并不常见,而且可能会根据您看到它的位置而有所不同。

就像在这篇u-net论文中一样,他们使用了两个输出通道,在第4页底部的那张纸上,通过softmax激活和日志丢失,他们为每个类使用前景/背景掩码和分类标签,如第5页顶部所述。这就是为什么我相信他们有两个输出面具。