Optimization 在所有测试中,神经网络在同一项目上发散

Optimization 在所有测试中,神经网络在同一项目上发散,optimization,neural-network,Optimization,Neural Network,在识别手写模式的多层神经网络的所有测试中,我很难找到导致值发散的原因。 以下是输出的照片: 每列代表一个特定的字母。结果应该是第一行的第一个字母占优势,第二行的第二个字母占优势。。。 在每次少量测试中,一个字母在所有值中占主导地位。这是什么原因造成的?答案在某种程度上取决于您使用的神经网络模型( 感知器,backprop,递归神经网络,LSTM),但很容易注意到的是输入到神经网络中的数据。您提到的三个输入非常接近。第一列之间的差异非常小。它们完全相同:0.31659和0.31660。第

在识别手写模式的多层神经网络的所有测试中,我很难找到导致值发散的原因。

以下是输出的照片:


每列代表一个特定的字母。结果应该是第一行的第一个字母占优势,第二行的第二个字母占优势。。。


在每次少量测试中,一个字母在所有值中占主导地位。这是什么原因造成的?

答案在某种程度上取决于您使用的神经网络模型(
感知器,backprop,递归神经网络,LSTM),但很容易注意到的是输入到神经网络中的数据。您提到的三个输入非常接近。第一列之间的差异非常小。它们完全相同:0.31659和0.31660。第二列对NN有同样的挑战:0.3993。第三列也很相似:0.2657。对于NN来说,要在这些值之间建立某种流形并不容易。你应该想办法增加这三列的对比度,因为它们看起来很相似。NN认为这些更改是无关紧要的,您需要多次迭代才能构建正确分类字母的超平面

你用什么样的神经网络?你是否使用了一些特定的NN框架?嘿,@user115你觉得我的答案有用吗?