Neural network CNN中从卷积层到完全连接层的输入尺寸
问题在于卷积神经网络的数学细节。假设网络的体系结构(目标是图像分类)也是如此Neural network CNN中从卷积层到完全连接层的输入尺寸,neural-network,artificial-intelligence,conv-neural-network,Neural Network,Artificial Intelligence,Conv Neural Network,问题在于卷积神经网络的数学细节。假设网络的体系结构(目标是图像分类)也是如此 输入图像32x32 第一个隐藏层3x28x28(由3个 尺寸5x5,步长=0且无填充),后跟 活化 池层(2x2区域上的池)生成 3x14x14 第二隐藏层6x10x10(由6个过滤器卷积而成 尺寸为5x5,步长=0且无填充),后跟 活化 池层(2x2区域上的池)生成 6x5x5 具有100个神经元的完全连接层(FCN)-1 具有10个神经元的完全连接层(FCN)-2 从我迄今为止的阅读资料中,我了解到每个6x5x
- 输入图像32x32
- 第一个隐藏层3x28x28(由3个 尺寸5x5,步长=0且无填充),后跟 活化
- 池层(2x2区域上的池)生成 3x14x14
- 第二隐藏层6x10x10(由6个过滤器卷积而成 尺寸为5x5,步长=0且无填充),后跟 活化
- 池层(2x2区域上的池)生成 6x5x5
- 具有100个神经元的完全连接层(FCN)-1
- 具有10个神经元的完全连接层(FCN)-2
(无,150)
,但其他CNN(如ResNet50)使用全局MAX函数来获得6x1x1x1
(输出张量的维度),然后将其展平(将变成(无,6)
)并馈入FC层
为了回答你的问题,其中展平会破坏空间排列,当你展平图像时,假设像素位置是Xij(即第i行,第j列=n*i+j
,其中n是图像的宽度),然后基于矩阵表示,我们可以说它的上邻居是Xi-1,j(n*(i-1)+j)
等等。对于其他相邻像素,由于像素与其相邻像素之间存在关联,FC层将自动调整权重以反映该信息
<> p>因此,可以考虑<代码>对流>激活->池> <代码>层组作为特征提取层,其输出张量(类似于向量中的维数/特征)这将被输入到网络末尾的标准ANN中。请使用换行符和段落以及粗体、斜体和代码功能,以使答案更清晰