Deep learning 为什么过滤器和要素图层具有相同数量的通道?

Deep learning 为什么过滤器和要素图层具有相同数量的通道?,deep-learning,computer-vision,conv-neural-network,detection,object-detection,Deep Learning,Computer Vision,Conv Neural Network,Detection,Object Detection,一些目标检测框架,如SSD(单激发多盒检测器)和更快的RCNN,具有用于分类和回归的“卷积滤波器”。以下内容来自SSD: 对于具有p个通道的大小为m×n的特征层,预测潜在检测参数的基本元素是一个3×3×p的小内核,该内核生成类别分数或相对于默认框坐标的形状偏移。在应用内核的每个m×n位置,它产生一个输出值 我的问题是:“小内核”的数量必须是p吗?设置一个任意数字k(与功能频道不同)怎么样? 在图中,部分额外特征层显示了小内核如何从每个输出位置提取p向量,预测不同纵横比和类别的检测 例如,从第一个

一些目标检测框架,如SSD(单激发多盒检测器)和更快的RCNN,具有用于分类和回归的“卷积滤波器”。以下内容来自SSD:

对于具有p个通道的大小为m×n的特征层,预测潜在检测参数的基本元素是一个3×3×p的小内核,该内核生成类别分数或相对于默认框坐标的形状偏移。在应用内核的每个m×n位置,它产生一个输出值

我的问题是:“小内核”的数量必须是p吗?设置一个任意数字k(与功能频道不同)怎么样?

在图中,部分
额外特征层
显示了
小内核
如何从每个输出位置提取
p
向量,预测不同
纵横比
类别
的检测

例如,从第一个卷积特征映射中,p是
(3x(类+4))
,而对于第二个卷积特征映射,p是
(6x(类+4))
。数字
3
6
表示为这些要素地图定义的
锚定
框的数量,对于每个锚定框,都有
类+4框坐标
输出

因此,您需要根据您为每个特征贴图确定的锚定框数量,以及您想要检测的类的数量来修复
p

我的问题是:“小内核”的数量必须是p吗?怎么 关于设置任意数字k(与特征不同 频道)


特征通道是
3x3xp
通道卷积的结果,因此它始终采用大小p,即内核的输出通道大小。请注意,
3x3xp
实际上是
3x3xin_channels xp
,例如,第一个要素层是通过将VGG中的
38x38x512
与内核
3x3x512xp
进行卷积来获得的,以获得
38x38xp

我是否正确翻译了您的问题标题?我想这就是你打算写的?如果没有,请再次回复我的编辑或问题。我担心的是标题中的问题似乎与文章正文中的问题不同。通道数与过滤器数。你能澄清一下吗?谢谢谢谢@CrisLuengo,你的标题更清晰了。