Machine learning 理解一篇关于VGGNet的文章

Machine learning 理解一篇关于VGGNet的文章,machine-learning,deep-learning,classification,conv-neural-network,imagenet,Machine Learning,Deep Learning,Classification,Conv Neural Network,Imagenet,我不理解这篇文章中关于VGNET的一段。也许有人能帮忙 在我看来,卷积层中的权重数是 p=w*h*d*n+n 其中w是过滤器的宽度,h是过滤器的高度,d是过滤器的深度,n是过滤器的数量 文章中写道: 假设一个三层3×3的onvolution堆栈的输入和输出都有C个通道,堆栈的参数化为3*(3^2*C^2)=27C^2 重量;同时,单个7×7转换层需要7^2*C^2=49C^2参数 我不明白这里的频道是什么意思,为什么使用这个公式 有人能给我解释一下吗 提前感谢。你的直觉是正确的;我们只需要解开

我不理解这篇文章中关于VGNET的一段。也许有人能帮忙

在我看来,卷积层中的权重数是

p=w*h*d*n+n
其中w是过滤器的宽度,h是过滤器的高度,d是过滤器的深度,n是过滤器的数量

文章中写道:

假设一个三层3×3的onvolution堆栈的输入和输出都有C个通道,堆栈的参数化为3*(3^2*C^2)=27C^2 重量;同时,单个7×7转换层需要7^2*C^2=49C^2参数

我不明白这里的频道是什么意思,为什么使用这个公式

有人能给我解释一下吗


提前感谢。

你的直觉是正确的;我们只需要解开他们的解释。对于第一种情况:

w = 3 # filter width
h = 3 # filter height
d = C # filter depth (number of channels is same as number of input filters; eg RGB is C=3)
n = C # number of output filters/channels
然后,这将生成
whdn=9C^2
参数。然后,他们还说有三个这样的堆叠,所以这是
27C^2

对于单个
7x7
过滤器,则它都是相同的
7x7xCxCx1

最后一个区别是,你在原来的帖子末尾再次添加
n
;这就是偏差术语,在VGG中它们会跳过(许多人跳过偏差术语;它们的值在某些设置中是有争议的)