Computer vision AlexNet中的神经元数量_Computer Vision_Neural Network_Deep Learning_Conv Neural Network

Computer vision AlexNet中的神经元数量

computer-vision neural-network deep-learning

Computer vision AlexNet中的神经元数量,computer-vision,neural-network,deep-learning,conv-neural-network,Computer Vision,Neural Network,Deep Learning,Conv Neural Network,在中，图像数据是3*224*224 第一个卷积层用96个大小为11*11*3的核过滤图像，步长为4个像素我怀疑第一层的输出神经元数量在我看来，输入是224*224*3=150528，那么输出应该是55*55*96=290400 但在论文中，他们描述的输出是253440 如何计算这一层神经元的数量？我也认为这是作者的错误，我在第10页和第11页找到了一个证明，你可以发现第一个conv的输出大小是290400。似乎输入大小是227x227，没有填充。我还认为他们在报纸上提到的是一个错误。请查看此

在中，图像数据是

3*224*224

第一个卷积层用96个大小为

11*11*3

的核过滤图像，步长为4个像素

我怀疑第一层的输出神经元数量

在我看来，输入是

224*224*3=150528

，那么输出应该是

55*55*96=290400

但在论文中，他们描述的输出是

如何计算这一层神经元的数量？

我也认为这是作者的错误，我在第10页和第11页找到了一个证明，你可以发现第一个conv的输出大小是290400。

似乎输入大小是227x227，没有填充。我还认为他们在报纸上提到的是一个错误。请查看此链接

它提到：

2012年赢得ImageNet挑战赛的Krizhevsky等人的体系结构接受了大小为[227x227x3]的图像。在第一个卷积层，它使用感受野大小为F=11、步幅为S=4、无零填充P=0的神经元。由于（227-11）/4+1=55，并且由于Conv层的深度为K=96，Conv层输出卷的大小为[55x55x96]。该体积中的555596个神经元中的每一个都连接到输入体积中大小为[11x11x3]的区域。此外，每个深度列中的所有96个神经元都连接到输入的相同[11x11x3]区域，当然权重不同。有趣的是，如果你阅读实际的论文，它声称输入的图像是224x224，这肯定是错误的，因为（224-11）/4+1显然不是整数。这让ConvNets历史上的许多人感到困惑，对所发生的事情知之甚少。我自己最好的猜测是Alex使用了3个额外像素的零填充，他在论文中没有提到

在我看来，你已经在报纸上发现了一个相当明显的错误。我同意第一层的输出应该是290400。我想我看到他们做了什么。48*55*96=253440. 这只是一个错误。@Aenimated1我不知道为什么是

48*55

。我认为过滤后的图像大小是

55*55

。你说得对。我只是说他们犯了个错误。这些事情经常发生是的，我犯了一个错误。google net的输入大小是224x224，alex net的输入大小是227x227。