Deep learning E-net深度学习体系结构

Deep learning E-net深度学习体系结构,deep-learning,conv-neural-network,image-segmentation,max-pooling,Deep Learning,Conv Neural Network,Image Segmentation,Max Pooling,研究论文可通过以下链接获得: 无法理解Enet体系结构的初始块 第3页研究论文中给出的声明: ENet初始块。MaxPooling使用非重叠的2×2窗口执行, 卷积有13个滤波器,经过拼接后总共有16个特征映射。 所以问题是,我们如何在串联后得到16个过滤器 让我们举一个例子,假设输入图像的dims为(128128,3),现在conv为((3,3),2,13),其中2是步幅大小,13是过滤器的数量,我们得到的输出为(64,64,13)(基本conv操作)。现在在右边的块中,我们有了max p

研究论文可通过以下链接获得:

无法理解Enet体系结构的初始块

第3页研究论文中给出的声明:

ENet初始块。MaxPooling使用非重叠的2×2窗口执行, 卷积有13个滤波器,经过拼接后总共有16个特征映射。


所以问题是,我们如何在串联后得到16个过滤器

让我们举一个例子,假设输入图像的dims为
(128128,3)
,现在conv为
((3,3),2,13)
,其中
2
是步幅大小,
13
是过滤器的数量,我们得到的输出为
(64,64,13)
(基本conv操作)。现在在右边的块中,我们有了
max pool
,它将输出返回为
(64,64,3)
。在
concat
两个输出上,我们有
(64,64,16)

在conv之后,我们得到了13个64x64的特征图,在输入图像的最大池化之后,我们得到了一个图像。然后,通道(3)如何添加特征映射(13)的数量?
13
表示conv层的通道输出,它与max pool层的
3
通道连接,。