Deep learning 为什么过滤器和要素图层具有相同数量的通道？_Deep Learning_Computer Vision_Conv Neural Network_Detection_Object Detection

Deep learning 为什么过滤器和要素图层具有相同数量的通道？

deep-learning computer-vision

Deep learning 为什么过滤器和要素图层具有相同数量的通道？,deep-learning,computer-vision,conv-neural-network,detection,object-detection,Deep Learning,Computer Vision,Conv Neural Network,Detection,Object Detection,一些目标检测框架，如SSD（单激发多盒检测器）和更快的RCNN，具有用于分类和回归的“卷积滤波器”。以下内容来自SSD：对于具有p个通道的大小为m×n的特征层，预测潜在检测参数的基本元素是一个3×3×p的小内核，该内核生成类别分数或相对于默认框坐标的形状偏移。在应用内核的每个m×n位置，它产生一个输出值我的问题是：“小内核”的数量必须是p吗？设置一个任意数字k（与功能频道不同）怎么样？在图中，部分额外特征层显示了小内核如何从每个输出位置提取p向量，预测不同纵横比和类别的检测例如，从第一个

一些目标检测框架，如SSD（单激发多盒检测器）和更快的RCNN，具有用于分类和回归的“卷积滤波器”。以下内容来自SSD：

对于具有p个通道的大小为m×n的特征层，预测潜在检测参数的基本元素是一个3×3×p的小内核，该内核生成类别分数或相对于默认框坐标的形状偏移。在应用内核的每个m×n位置，它产生一个输出值

我的问题是：“小内核”的数量必须是p吗？设置一个任意数字k（与功能频道不同）怎么样？

在图中，部分

额外特征层

显示了

小内核

如何从每个输出位置提取

向量，预测不同

纵横比

和

类别

的检测

例如，从第一个卷积特征映射中，p是

（3x（类+4））

，而对于第二个卷积特征映射，p是

（6x（类+4））

。数字

和

表示为这些要素地图定义的

锚定

框的数量，对于每个锚定框，都有

类+4框坐标

输出

因此，您需要根据您为每个特征贴图确定的锚定框数量，以及您想要检测的类的数量来修复

我的问题是：“小内核”的数量必须是p吗？怎么关于设置任意数字k（与特征不同频道）

特征通道是

3x3xp

通道卷积的结果，因此它始终采用大小p，即内核的输出通道大小。请注意，

3x3xp

实际上是

3x3xin_channels xp

，例如，第一个要素层是通过将VGG中的

38x38x512

与内核

3x3x512xp

进行卷积来获得的，以获得

38x38xp

我是否正确翻译了您的问题标题？我想这就是你打算写的？如果没有，请再次回复我的编辑或问题。我担心的是标题中的问题似乎与文章正文中的问题不同。通道数与过滤器数。你能澄清一下吗？谢谢谢谢@CrisLuengo，你的标题更清晰了。