Deep learning 图形解释深度学习

Deep learning 图形解释深度学习,deep-learning,recurrent-neural-network,rnn,Deep Learning,Recurrent Neural Network,Rnn,我正在尝试建立一个对句子进行分类的模型。我正在使用一个Reccurent神经网络(RNN)模型“GRUcell”,我有下面的图表。我用的损失函数是交叉熵。 你能解释一下为什么每次迭代后的损失都接近0到1吗? 我找不到任何解释,谢谢。 根据您提供的信息,它看起来像是在一个批次结束时下降,然后在下一个批次开始时再次上升。这可能是由于学习率高,随着时间的推移衰减不够。 尝试调整参数,看看是否有帮助 干杯感谢您的帮助,我正在使用Adam optimizer,学习率为0.001。我认为Adam optim

我正在尝试建立一个对句子进行分类的模型。我正在使用一个Reccurent神经网络(RNN)模型“GRUcell”,我有下面的图表。我用的损失函数是交叉熵。 你能解释一下为什么每次迭代后的损失都接近0到1吗? 我找不到任何解释,谢谢。

根据您提供的信息,它看起来像是在一个批次结束时下降,然后在下一个批次开始时再次上升。这可能是由于学习率高,随着时间的推移衰减不够。 尝试调整参数,看看是否有帮助


干杯

感谢您的帮助,我正在使用Adam optimizer,学习率为0.001。我认为Adam optimizer可以自动调整学习速率。我将把学习率改为0.0001,看看会发生什么。