Machine learning 使用Imagenet 2011上训练的深度卷积神经网络获得低精度

Machine learning 使用Imagenet 2011上训练的深度卷积神经网络获得低精度,machine-learning,deep-learning,Machine Learning,Deep Learning,我已经下载了Imagenet2011数据集,并尝试使用说明在其上训练imagenet网络。我使用了大约500K的图像进行训练,70K的图像进行验证 我还下载了用于实验的ILSVRC 2012验证集 结果如下: 关于ILSVRC 2012官方验证集: 我的网络:46%准确率,原Caffe Imagenet网络:56%准确率 在我的验证集上:我的网络:53%的准确率,原始Caffe Imagenet网络:80%的准确率 关于我的训练数据(检查是否过度拟合):我的网络:99%准确度,原始Caffe I

我已经下载了Imagenet2011数据集,并尝试使用说明在其上训练imagenet网络。我使用了大约500K的图像进行训练,70K的图像进行验证

我还下载了用于实验的ILSVRC 2012验证集

结果如下:

关于ILSVRC 2012官方验证集: 我的网络:46%准确率,原Caffe Imagenet网络:56%准确率

在我的验证集上:我的网络:53%的准确率,原始Caffe Imagenet网络:80%的准确率

关于我的训练数据(检查是否过度拟合):我的网络:99%准确度,原始Caffe Imagenet网络:70%准确度

我想寻求一些有关培训的帮助和提示:

  • 我感觉到我的新人际网络过于合适了。你同意吗?我应该使用更多的图像吗?使用数据扩充来机械地增加训练集的大小?或者更改退出参数

  • 在Krizhevsky等人的论文“带深度卷积神经网络的Imagenet分类”中,作者使用了1.2M图像进行训练,并使用了数据扩充,将训练数据的大小增加了2048倍。但是,在为imagenet培训提供的代码中没有进行数据扩充(随机翻转除外)。是否真的不需要数据扩充

  • 我只对ImageNet数据集中的大约100个类感兴趣。假设我要培训imagenet网络(从零开始),只有100个类,总共有100K个图像。这比原来的120万张图片要少很多,但也少了很多种类。在这100个类别中,网络是否会过度匹配或表现良好?或者我应该为100个类使用不同的网络体系结构吗?培训Imagenet网络,然后只使用这100个类进行微调是否更好

  • 对于最初的1K类别,我只有500K图像(而不是1.2M)。我应该使用具有更多图像的类别吗?使用更多的类别(和图像)怎么样

  • 提前谢谢

    吉尔

    克里哲夫斯基、亚历克斯、伊利亚·萨茨基和杰弗里·E·辛顿。“深卷积神经网络的图像网络分类”,《神经信息处理系统的进展》。2012‏


    “数据增强的第一种形式包括生成图像平移和水平反射。我们通过提取随机224 x224面片(及其水平反射)来实现这一点。”从256x 256张图像中,我们在这些提取的补丁上训练我们的网络4。这将我们的训练集的大小增加了2048倍,当然,产生的训练示例是高度相互依赖的。”

    如果您在caffe的github页面上发布,您可能会得到更好的响应,它非常活跃。我认为数据扩充和训练数据量非常重要——此外,对于每个训练集大小,deep net的最佳参数都会不同,因此默认参数不是一个好的选择谢谢您的评论。我在谷歌群组上尝试了Caffe的用户群,但没有得到回应。@GilLevi嗨,你对100类分类的方法是什么?我也只对10个类感兴趣,但是我不能用AlexNet类型的体系结构实现良好的准确性。