Machine learning 理解一篇关于VGGNet的文章_Machine Learning_Deep Learning_Classification_Conv Neural Network_Imagenet

Machine learning 理解一篇关于VGGNet的文章

machine-learning deep-learning

Machine learning 理解一篇关于VGGNet的文章,machine-learning,deep-learning,classification,conv-neural-network,imagenet,Machine Learning,Deep Learning,Classification,Conv Neural Network,Imagenet,我不理解这篇文章中关于VGNET的一段。也许有人能帮忙在我看来，卷积层中的权重数是 p=w*h*d*n+n 其中w是过滤器的宽度，h是过滤器的高度，d是过滤器的深度，n是过滤器的数量文章中写道：假设一个三层3×3的onvolution堆栈的输入和输出都有C个通道，堆栈的参数化为3*（3^2*C^2）=27C^2 重量；同时，单个7×7转换层需要7^2*C^2=49C^2参数我不明白这里的频道是什么意思，为什么使用这个公式有人能给我解释一下吗提前感谢。你的直觉是正确的；我们只需要解开

我不理解这篇文章中关于VGNET的一段。也许有人能帮忙

在我看来，卷积层中的权重数是

p=w*h*d*n+n

其中w是过滤器的宽度，h是过滤器的高度，d是过滤器的深度，n是过滤器的数量

文章中写道：

假设一个三层3×3的onvolution堆栈的输入和输出都有C个通道，堆栈的参数化为3*（3^2*C^2）=27C^2 重量；同时，单个7×7转换层需要7^2*C^2=49C^2参数

我不明白这里的频道是什么意思，为什么使用这个公式

有人能给我解释一下吗

提前感谢。

你的直觉是正确的；我们只需要解开他们的解释。对于第一种情况：

w = 3 # filter width
h = 3 # filter height
d = C # filter depth (number of channels is same as number of input filters; eg RGB is C=3)
n = C # number of output filters/channels

然后，这将生成

whdn=9C^2

参数。然后，他们还说有三个这样的堆叠，所以这是

27C^2

对于单个

7x7

过滤器，则它都是相同的

7x7xCxCx1

最后一个区别是，你在原来的帖子末尾再次添加

；这就是偏差术语，在VGG中它们会跳过（许多人跳过偏差术语；它们的值在某些设置中是有争议的）