Neural network 在FCN(语义分割)中,类预测层位于何处?它是如何实现每像素预测的?

Neural network 在FCN(语义分割)中,类预测层位于何处?它是如何实现每像素预测的?,neural-network,deep-learning,conv-neural-network,image-segmentation,Neural Network,Deep Learning,Conv Neural Network,Image Segmentation,最近,我仔细阅读了FCN的论文,仍然有一个我自己没有回答的问题 简介:FCN是一种密集预测,预测每个像素属于哪个类别。在PASCAL的情况下,它将是21个类(21个对象+1个背景)。对于预测,较旧的方法是使用具有21个输出节点的FC层,并选择最高输出作为类。该层(类别预测层)位于网络的最末端,在我们计算损失函数时,它超出了类别。更新的方法,它可以由21个1x1 conv操作代替 我的问题是,一旦我读了这篇文章(特别是第4.1章),类预测层似乎就在粗略输出(融合特征映射)之后,然后是上采样层(见下

最近,我仔细阅读了FCN的论文,仍然有一个我自己没有回答的问题

简介:FCN是一种密集预测,预测每个像素属于哪个类别。在PASCAL的情况下,它将是21个类(21个对象+1个背景)。对于预测,较旧的方法是使用具有21个输出节点的FC层,并选择最高输出作为类。该层(类别预测层)位于网络的最末端,在我们计算损失函数时,它超出了类别。更新的方法,它可以由21个1x1 conv操作代替

我的问题是,一旦我读了这篇文章(特别是第4.1章),类预测层似乎就在粗略输出(融合特征映射)之后,然后是上采样层(见下面的图1)。在这种情况下,类预测层不在网络的最末端。这如何预测每个像素类别?起初,我认为类预测层位于网络的最末端(参见下面的图2)。因此,每像素将有21个1x1 conv操作用于每像素类预测。但是,当我阅读了我贴在下面的论文中的第4.1章后,我的想法改变了。你觉得这个怎么样

最好的

阿尔丁

单击下面的链接以查看附加图像