Machine learning 使用Imagenet 2011上训练的深度卷积神经网络获得低精度_Machine Learning_Deep Learning

Machine learning 使用Imagenet 2011上训练的深度卷积神经网络获得低精度

machine-learning deep-learning

Machine learning 使用Imagenet 2011上训练的深度卷积神经网络获得低精度,machine-learning,deep-learning,Machine Learning,Deep Learning,我已经下载了Imagenet2011数据集，并尝试使用说明在其上训练imagenet网络。我使用了大约500K的图像进行训练，70K的图像进行验证我还下载了用于实验的ILSVRC 2012验证集结果如下：关于ILSVRC 2012官方验证集：我的网络：46%准确率，原Caffe Imagenet网络：56%准确率在我的验证集上：我的网络：53%的准确率，原始Caffe Imagenet网络：80%的准确率关于我的训练数据（检查是否过度拟合）：我的网络：99%准确度，原始Caffe I

我已经下载了Imagenet2011数据集，并尝试使用说明在其上训练imagenet网络。我使用了大约500K的图像进行训练，70K的图像进行验证

我还下载了用于实验的ILSVRC 2012验证集

结果如下：

关于ILSVRC 2012官方验证集： 我的网络：46%准确率，原Caffe Imagenet网络：56%准确率

在我的验证集上：我的网络：53%的准确率，原始Caffe Imagenet网络：80%的准确率

关于我的训练数据（检查是否过度拟合）：我的网络：99%准确度，原始Caffe Imagenet网络：70%准确度

我想寻求一些有关培训的帮助和提示：

我感觉到我的新人际网络过于合适了。你同意吗？我应该使用更多的图像吗？使用数据扩充来机械地增加训练集的大小？或者更改退出参数

在Krizhevsky等人的论文“带深度卷积神经网络的Imagenet分类”中，作者使用了1.2M图像进行训练，并使用了数据扩充，将训练数据的大小增加了2048倍。但是，在为imagenet培训提供的代码中没有进行数据扩充（随机翻转除外）。是否真的不需要数据扩充

我只对ImageNet数据集中的大约100个类感兴趣。假设我要培训imagenet网络（从零开始），只有100个类，总共有100K个图像。这比原来的120万张图片要少很多，但也少了很多种类。在这100个类别中，网络是否会过度匹配或表现良好？或者我应该为100个类使用不同的网络体系结构吗？培训Imagenet网络，然后只使用这100个类进行微调是否更好

对于最初的1K类别，我只有500K图像（而不是1.2M）。我应该使用具有更多图像的类别吗？使用更多的类别（和图像）怎么样

提前谢谢

吉尔

克里哲夫斯基、亚历克斯、伊利亚·萨茨基和杰弗里·E·辛顿。“深卷积神经网络的图像网络分类”，《神经信息处理系统的进展》。2012‏

“数据增强的第一种形式包括生成图像平移和水平反射。我们通过提取随机224 x224面片（及其水平反射）来实现这一点。”从256x 256张图像中，我们在这些提取的补丁上训练我们的网络4。这将我们的训练集的大小增加了2048倍，当然，产生的训练示例是高度相互依赖的。”

如果您在caffe的github页面上发布，您可能会得到更好的响应，它非常活跃。我认为数据扩充和训练数据量非常重要——此外，对于每个训练集大小，deep net的最佳参数都会不同，因此默认参数不是一个好的选择谢谢您的评论。我在谷歌群组上尝试了Caffe的用户群，但没有得到回应。@GilLevi嗨，你对100类分类的方法是什么？我也只对10个类感兴趣，但是我不能用AlexNet类型的体系结构实现良好的准确性。