Machine learning 卷积神经网络(CNN)中特征映射的缩小

Machine learning 卷积神经网络(CNN)中特征映射的缩小,machine-learning,deep-learning,conv-neural-network,Machine Learning,Deep Learning,Conv Neural Network,我正在读一篇关于CNN的论文,但我不明白这句话。我们没有使用最大池层来减小特征图的大小,而是使用卷积层来加快步伐。 我不知道这如何取代我所缺少的最大池?天真地说,CNN的过滤器通过在每个可能的位置上移动过滤器矩阵(如下图所示,为简单起见,为3x3x1)来工作。这意味着您每次向右移动一个过滤器,当行准备就绪时,您可以来回移动 在以下gif中,原始图像为虚线,过滤器为灰色,结果为绿色图像: 但是,您也可以每次移动2。这与简单地对结果进行二次采样是一样的。如果以2的步幅移动,则将要素地图尺寸除以2(

我正在读一篇关于CNN的论文,但我不明白这句话。我们没有使用最大池层来减小特征图的大小,而是使用卷积层来加快步伐。
我不知道这如何取代我所缺少的最大池?

天真地说,CNN的过滤器通过在每个可能的位置上移动过滤器矩阵(如下图所示,为简单起见,为3x3x1)来工作。这意味着您每次向右移动一个过滤器,当行准备就绪时,您可以来回移动

在以下gif中,原始图像为虚线,过滤器为灰色,结果为绿色图像:


但是,您也可以每次移动2。这与简单地对结果进行二次采样是一样的。如果以2的步幅移动,则将要素地图尺寸除以2(两者)。这意味着您的要素地图只有原始大小的1/4。这与池减少要素映射大小的方式完全相同。事实上,卷积滤波器可以学习平均和最大池。

你知道步幅是什么吗?当我们使用stride=1和stride=2时会发生什么?不,我知道,但这将如何取代最大池?这将如何减少要素地图的大小?或者“按层增加步幅”的含义是什么?好的,但卷积滤波器的含义是什么?AhmedMohamed max pooling有点复杂,但平均池很简单:如果3x3x1滤波器的所有权重都设置为1/9,并且激活函数是标识,那么这就是平均池。