Deep learning E-net深度学习体系结构
研究论文可通过以下链接获得: 无法理解Enet体系结构的初始块 第3页研究论文中给出的声明: ENet初始块。MaxPooling使用非重叠的2×2窗口执行, 卷积有13个滤波器,经过拼接后总共有16个特征映射。Deep learning E-net深度学习体系结构,deep-learning,conv-neural-network,image-segmentation,max-pooling,Deep Learning,Conv Neural Network,Image Segmentation,Max Pooling,研究论文可通过以下链接获得: 无法理解Enet体系结构的初始块 第3页研究论文中给出的声明: ENet初始块。MaxPooling使用非重叠的2×2窗口执行, 卷积有13个滤波器,经过拼接后总共有16个特征映射。 所以问题是,我们如何在串联后得到16个过滤器 让我们举一个例子,假设输入图像的dims为(128128,3),现在conv为((3,3),2,13),其中2是步幅大小,13是过滤器的数量,我们得到的输出为(64,64,13)(基本conv操作)。现在在右边的块中,我们有了max p
所以问题是,我们如何在串联后得到16个过滤器 让我们举一个例子,假设输入图像的dims为
(128128,3)
,现在conv为((3,3),2,13)
,其中2
是步幅大小,13
是过滤器的数量,我们得到的输出为(64,64,13)
(基本conv操作)。现在在右边的块中,我们有了max pool
,它将输出返回为(64,64,3)
。在concat
两个输出上,我们有(64,64,16)
在conv之后,我们得到了13个64x64的特征图,在输入图像的最大池化之后,我们得到了一个图像。然后,通道(3)如何添加特征映射(13)的数量?13
表示conv层的通道输出,它与max pool层的3
通道连接,。