Machine learning 深度神经网络精度的局部极小值

Machine learning 深度神经网络精度的局部极小值,machine-learning,neural-network,deep-learning,Machine Learning,Neural Network,Deep Learning,对于在精度图中显示局部极小值的深层神经网络,您会给出什么建议来提高其精度 您所观察到的是训练期间模型精度的波动,这是因为您正在计算每个小批量的梯度。这些是为了近似整个训练集的梯度,但它们并不总是精确的,因此有时您会观察到精度下降 有些波动也可能是由于损失函数与精度指标不完全相关 术语“局部最小值”通常用于描述损失函数的局部最小值与其全局最小值不同的情况。我不会在这里用它来描述精度图,因为它可能会引起混淆。毕竟,您正试图最大限度地提高精度。水平轴上有什么?jafergas,x轴是迭代次数。我有12

对于在精度图中显示局部极小值的深层神经网络,您会给出什么建议来提高其精度


您所观察到的是训练期间模型精度的波动,这是因为您正在计算每个小批量的梯度。这些是为了近似整个训练集的梯度,但它们并不总是精确的,因此有时您会观察到精度下降

有些波动也可能是由于损失函数与精度指标不完全相关


术语“局部最小值”通常用于描述损失函数的局部最小值与其全局最小值不同的情况。我不会在这里用它来描述精度图,因为它可能会引起混淆。毕竟,您正试图最大限度地提高精度。

水平轴上有什么?jafergas,x轴是迭代次数。我有12个小批量。你的小批量是多少?@jafergas,小批量是1024谢谢你,伊姆兰。不客气!如果这完全解决了你的问题,请接受我的回答