Keras 在这种情况下，哪种模式更好？_Keras

Keras 在这种情况下，哪种模式更好？

keras

Keras 在这种情况下，哪种模式更好？,keras,Keras,有两种神经网络模型第一个模型没有任何正则化，显示了从第10纪元开始的过度拟合。所以这个模型在第九纪元停止训练。验证损失最少发生在第9纪元第二个模型有一个正则化（退出），并且没有显示过拟合。所以这个模型比第一个模型训练的时间要长得多。但最小验证损失值不高于第一个模型的最小验证损失值。尽管该模型可以进行更多的训练，但该模型似乎没有达到第一个模型验证损失最小的值这些模型训练相同的数据集，除了是否使用正则化外，结构几乎相同在这种情况下，哪一个更好？如果你可以肯定地说第一个太合适了，我就不使用了。

有两种神经网络模型

第一个模型没有任何正则化，显示了从第10纪元开始的过度拟合。所以这个模型在第九纪元停止训练。验证损失最少发生在第9纪元

第二个模型有一个正则化（退出），并且没有显示过拟合。所以这个模型比第一个模型训练的时间要长得多。但最小验证损失值不高于第一个模型的最小验证损失值。尽管该模型可以进行更多的训练，但该模型似乎没有达到第一个模型验证损失最小的值

这些模型训练相同的数据集，除了是否使用正则化外，结构几乎相同

在这种情况下，哪一个更好？

如果你可以肯定地说第一个太合适了，我就不使用了。损失值是基于训练集而不是测试集计算的，因此该值可能很高，但这并不意味着该模型能够很好地处理测试数据。

如果第二个模型在以后的epohcs中继续获得不同的损失值，但损失没有减少，您可以尝试修补参数或模型结构，以找到正确的平衡。但我更可能相信在大多数情况下不会过度拟合的模型。

还可以考虑使用scipy train_test_split来生成测试数据。这可以作为“验证”传递到model.fit，它可以为您提供判断模型性能的新指标谢谢您的回答。我想得到确认，所以我会再问你一次。根据你的回答，即使我在第十纪元之前（过度拟合之前）训练了第一个模型，使用第一个模型也不是一个好主意。对吗？每个机器学习问题都是不同的，所以很难说你应该/不应该使用某个模型。另一个减少过度拟合可能性的好方法是简单地使用更多的训练数据！在放弃之前，我可能会在第一款车型上尝试一下。