Machine learning 卷积神经网络i';如果我试图训练的是一个特定的损失值范围,我应该如何避免它?

Machine learning 卷积神经网络i';如果我试图训练的是一个特定的损失值范围,我应该如何避免它?,machine-learning,neural-network,classification,deep-learning,conv-neural-network,Machine Learning,Neural Network,Classification,Deep Learning,Conv Neural Network,描述:我正在尝试从零开始训练一个类似alexnet(实际上是相同的,但没有团队)的CNN(50000张图片,1000个班级和x10增强版)。每个历元有50000次迭代,图像大小为227x227x3 在最初的几个时期,成本平稳下降,精度有所提高,但现在我面临的问题是,成本已经稳定在~6(从13开始)很长一段时间,这是一天,成本在6.02-6.7范围内不断波动。准确性也变得停滞不前 现在我不知道该做什么,也没有任何适当的指导。这就是在局部极小值中消失梯度的问题吗?那么,为了避免这种情况,我应该降低我

描述:我正在尝试从零开始训练一个类似alexnet(实际上是相同的,但没有团队)的CNN(50000张图片,1000个班级和x10增强版)。每个历元有50000次迭代,图像大小为227x227x3

在最初的几个时期,成本平稳下降,精度有所提高,但现在我面临的问题是,成本已经稳定在~6(从13开始)很长一段时间,这是一天,成本在6.02-6.7范围内不断波动。准确性也变得停滞不前


现在我不知道该做什么,也没有任何适当的指导。这就是在局部极小值中消失梯度的问题吗?那么,为了避免这种情况,我应该降低我的学习率吗?目前,使用Relu激活(有助于避免消失梯度)、Glorot初始化和96批次大小时,学习率为0.08。在进行另一次改变和连续几天的训练之前,我想确保自己朝着正确的方向前进。可能的原因是什么?

可能是您已经达到了最适合您的数据的准确度?分类错误有多大?如果我没有错的话,如果训练进行得最好的话,成本不应该接近0(?或~1)。我应该试试更大的网络吗?验证误差从6减小到4,并变得停滞。现在的准确度大约是20%。成本函数不必变成0,它必须达到它的最小值。你的图像是RGB格式的,不是吗?如果是这样,是否可以尝试使用灰度版本来获得调试的第一个结果?当前网络结构是什么?当前网络类似于alexnet,输入图像为RGB(227x227x3)。有没有可能卡在当地的最低限度?或者如何确定训练数据的成本是最佳的?要回答这个问题,您可以尝试使用其他数据初始化权重。在哪里可以找到包含数据样本等的alexnet项目?我也想实施它。我访问了网页,但没有找到数据集