Computer vision AlexNet中的神经元数量

Computer vision AlexNet中的神经元数量,computer-vision,neural-network,deep-learning,conv-neural-network,Computer Vision,Neural Network,Deep Learning,Conv Neural Network,在中,图像数据是3*224*224 第一个卷积层用96个大小为11*11*3的核过滤图像,步长为4个像素 我怀疑第一层的输出神经元数量 在我看来,输入是224*224*3=150528,那么输出应该是55*55*96=290400 但在论文中,他们描述的输出是253440 如何计算这一层神经元的数量?我也认为这是作者的错误,我在第10页和第11页找到了一个证明,你可以发现第一个conv的输出大小是290400。似乎输入大小是227x227,没有填充。我还认为他们在报纸上提到的是一个错误。请查看此

在中,图像数据是
3*224*224

第一个卷积层用96个大小为
11*11*3
的核过滤图像,步长为4个像素

我怀疑第一层的输出神经元数量

在我看来,输入是
224*224*3=150528
,那么输出应该是
55*55*96=290400

但在论文中,他们描述的输出是
253440


如何计算这一层神经元的数量?

我也认为这是作者的错误,我在第10页和第11页找到了一个证明,你可以发现第一个conv的输出大小是290400。

似乎输入大小是227x227,没有填充。我还认为他们在报纸上提到的是一个错误。请查看此链接

它提到:

2012年赢得ImageNet挑战赛的Krizhevsky等人的体系结构接受了大小为[227x227x3]的图像。在第一个卷积层,它使用感受野大小为F=11、步幅为S=4、无零填充P=0的神经元。由于(227-11)/4+1=55,并且由于Conv层的深度为K=96,Conv层输出卷的大小为[55x55x96]。该体积中的555596个神经元中的每一个都连接到输入体积中大小为[11x11x3]的区域。此外,每个深度列中的所有96个神经元都连接到输入的相同[11x11x3]区域,当然权重不同。有趣的是,如果你阅读实际的论文,它声称输入的图像是224x224,这肯定是错误的,因为(224-11)/4+1显然不是整数。这让ConvNets历史上的许多人感到困惑,对所发生的事情知之甚少。我自己最好的猜测是Alex使用了3个额外像素的零填充,他在论文中没有提到


在我看来,你已经在报纸上发现了一个相当明显的错误。我同意第一层的输出应该是290400。我想我看到他们做了什么。48*55*96=253440. 这只是一个错误。@Aenimated1我不知道为什么是
48*55
。我认为过滤后的图像大小是
55*55
。你说得对。我只是说他们犯了个错误。这些事情经常发生是的,我犯了一个错误。google net的输入大小是224x224,alex net的输入大小是227x227。