Deep learning 深入学习什么'；两个3*3卷积滤波器和一个5*5卷积滤波器之间的区别是什么？_Deep Learning_Conv Neural Network

Deep learning 深入学习什么'；两个3*3卷积滤波器和一个5*5卷积滤波器之间的区别是什么？

deep-learning

Deep learning 深入学习什么'；两个3*3卷积滤波器和一个5*5卷积滤波器之间的区别是什么？,deep-learning,conv-neural-network,Deep Learning,Conv Neural Network,例如，对于著名的AlexNet架构，使用两个3*3卷积滤波器与使用一个5*5卷积滤波器有何不同下图中的红色矩形突出显示了两个3*3卷积滤波器和一个5*5卷积滤波器用另一个5*5卷积滤波器来代替两个3*3卷积滤波器，或者用另一个5*5卷积滤波器，或者用另一个5*5卷积滤波器来代替怎么样？我从论文中发现我们在整个网络中使用非常小的3×3感受野，而不是在第一个conv.层中使用相对较大的感受野（例如，步幅为4英寸的11×11感受野（Krizhevsky等人，2012），或步幅为2英寸的7×7

例如，对于著名的AlexNet架构，使用

两个3*3卷积滤波器与使用一个5*5卷积滤波器有何不同
下图中的红色矩形突出显示了两个3*3卷积滤波器
和一个5*5卷积滤波器



用另一个5*5卷积滤波器
来代替两个3*3卷积滤波器
，或者用另一个5*5卷积滤波器
，或者用另一个5*5卷积滤波器来代替怎么样？
我从论文
中发现
我们在整个网络中使用非常小的3×3感受野，而不是在第一个conv.层中使用相对较大的感受野（例如，步幅为4英寸的11×11感受野（Krizhevsky等人，2012），或步幅为2英寸的7×7感受野（Zeiler&Fergus，2013；Sermanet等人，2014）），这些感受野与每个像素的输入（步幅为1）相卷积。不难看出，由两个3×3 conv.layers（中间没有空间池）组成的堆栈具有5×5的有效感受野；三个这样的层具有7×7的有效感受野
两个3*3卷积滤波器相当于一个5*5卷积滤波器
两个3*3卷积滤波器的参数将少于一个5*5卷积滤波器
与一个5*5卷积滤波器相比，两个3*3卷积滤波器将使网络更深入，提取更复杂的特征
论文：
如果你还有一些疑问，希望这篇文章对你有所帮助
如果堆叠两个3x3 conv层，它最终会得到一个5的接收场（与一个5x5 conv层相同）作为输入。但是，使用较小的conv层（如3x3）的优点是它需要较少的参数（您可以对两个3x3层和一个5x5层-->进行参数计算，如2*（33）=18和1（5*5）=25，假设一个通道）。另外，两个conv层之间的非线性比一个5x5层更大，因此它具有更大的辨别能力。
对于感受野部分，我希望我的这篇论文能帮助你形象化（顺便说一句，这是我考试的答题纸）：
两个过滤器之间的非线性可以引入比一个过滤器更复杂的功能…你能提供任何关于这方面的参考或论文吗？我建议你参加CS231n斯坦福课程。具体来说，请看本课程的注释：在“宁愿一堆小的过滤器CONV，也不要一个大的感受野CONV层”一段中