Deep learning 深入学习什么';两个3*3卷积滤波器和一个5*5卷积滤波器之间的区别是什么?

Deep learning 深入学习什么';两个3*3卷积滤波器和一个5*5卷积滤波器之间的区别是什么?,deep-learning,conv-neural-network,Deep Learning,Conv Neural Network,例如,对于著名的AlexNet架构,使用两个3*3卷积滤波器与使用一个5*5卷积滤波器有何不同 下图中的红色矩形突出显示了两个3*3卷积滤波器和一个5*5卷积滤波器 用另一个5*5卷积滤波器来代替两个3*3卷积滤波器,或者用另一个5*5卷积滤波器,或者用另一个5*5卷积滤波器来代替怎么样?我从论文中发现 我们在整个网络中使用非常小的3×3感受野,而不是在第一个conv.层中使用相对较大的感受野(例如,步幅为4英寸的11×11感受野(Krizhevsky等人,2012),或步幅为2英寸的7×7

例如,对于著名的AlexNet架构,使用
两个3*3卷积滤波器与使用
一个5*5卷积滤波器有何不同

下图中的
红色矩形突出显示了
两个3*3卷积滤波器
一个5*5卷积滤波器


用另一个
5*5卷积滤波器
来代替
两个3*3卷积滤波器
,或者用另一个
5*5卷积滤波器
,或者用另一个
5*5卷积滤波器来代替
怎么样?

我从论文
中发现

我们在整个网络中使用非常小的3×3感受野,而不是在第一个conv.层中使用相对较大的感受野(例如,步幅为4英寸的11×11感受野(Krizhevsky等人,2012),或步幅为2英寸的7×7感受野(Zeiler&Fergus,2013;Sermanet等人,2014)),这些感受野与每个像素的输入(步幅为1)相卷积。不难看出,由两个3×3 conv.layers(中间没有空间池)组成的堆栈具有5×5的有效感受野;三个这样的层具有7×7的有效感受野

  • 两个3*3卷积滤波器相当于一个5*5卷积滤波器

  • 两个3*3卷积滤波器的参数将少于一个5*5卷积滤波器

  • 与一个5*5卷积滤波器相比,两个3*3卷积滤波器将使网络更深入,提取更复杂的特征

  • 论文:

    如果你还有一些疑问,希望这篇文章对你有所帮助

    如果堆叠两个3x3 conv层,它最终会得到一个5的接收场(与一个5x5 conv层相同)作为输入。但是,使用较小的conv层(如3x3)的优点是它需要较少的参数(您可以对两个3x3层和一个5x5层-->进行参数计算,如2*(33)=18和1(5*5)=25,假设一个通道)。另外,两个conv层之间的非线性比一个5x5层更大,因此它具有更大的辨别能力。 对于感受野部分,我希望我的这篇论文能帮助你形象化(顺便说一句,这是我考试的答题纸):

    两个过滤器之间的非线性可以引入比一个过滤器更复杂的功能…你能提供任何关于这方面的参考或论文吗?我建议你参加CS231n斯坦福课程。具体来说,请看本课程的注释:在“宁愿一堆小的过滤器CONV,也不要一个大的感受野CONV层”一段中