Keras 在这种情况下,哪种模式更好?

Keras 在这种情况下,哪种模式更好?,keras,Keras,有两种神经网络模型 第一个模型没有任何正则化,显示了从第10纪元开始的过度拟合。所以这个模型在第九纪元停止训练。验证损失最少发生在第9纪元 第二个模型有一个正则化(退出),并且没有显示过拟合。所以这个模型比第一个模型训练的时间要长得多。但最小验证损失值不高于第一个模型的最小验证损失值。尽管该模型可以进行更多的训练,但该模型似乎没有达到第一个模型验证损失最小的值 这些模型训练相同的数据集,除了是否使用正则化外,结构几乎相同 在这种情况下,哪一个更好?如果你可以肯定地说第一个太合适了,我就不使用了。

有两种神经网络模型

第一个模型没有任何正则化,显示了从第10纪元开始的过度拟合。所以这个模型在第九纪元停止训练。验证损失最少发生在第9纪元

第二个模型有一个正则化(退出),并且没有显示过拟合。所以这个模型比第一个模型训练的时间要长得多。但最小验证损失值不高于第一个模型的最小验证损失值。尽管该模型可以进行更多的训练,但该模型似乎没有达到第一个模型验证损失最小的值

这些模型训练相同的数据集,除了是否使用正则化外,结构几乎相同


在这种情况下,哪一个更好?

如果你可以肯定地说第一个太合适了,我就不使用了。损失值是基于训练集而不是测试集计算的,因此该值可能很高,但这并不意味着该模型能够很好地处理测试数据。
如果第二个模型在以后的epohcs中继续获得不同的损失值,但损失没有减少,您可以尝试修补参数或模型结构,以找到正确的平衡。但我更可能相信在大多数情况下不会过度拟合的模型。

还可以考虑使用scipy train_test_split来生成测试数据。这可以作为“验证”传递到model.fit,它可以为您提供判断模型性能的新指标谢谢您的回答。我想得到确认,所以我会再问你一次。根据你的回答,即使我在第十纪元之前(过度拟合之前)训练了第一个模型,使用第一个模型也不是一个好主意。对吗?每个机器学习问题都是不同的,所以很难说你应该/不应该使用某个模型。另一个减少过度拟合可能性的好方法是简单地使用更多的训练数据!在放弃之前,我可能会在第一款车型上尝试一下。