Tensorflow 列车和测试误差之间的间隙很小,这是否意味着过度装配?

Tensorflow 列车和测试误差之间的间隙很小,这是否意味着过度装配?,tensorflow,machine-learning,Tensorflow,Machine Learning,我正在研究一个包含368609个样本和34个特征的数据集,我想使用一个神经网络来预测keras的潜伏期(真实值),该模型有3个隐藏层,每层有1024个神经元,我对每个隐藏层使用了drop_out(50%)和l2正则化(0.001)。问题是我得到的测试平均绝对误差为3.5505 ms,训练平均绝对误差为3.4528 ms。在这里,列车误差比测试误差小一个小间隙,这是否意味着我们这里有过拟合问题 如果你的训练集的精确度很高,而测试集的精确度很低,这通常意味着你的训练集的精确度过高。所以在你的情况下-

我正在研究一个包含368609个样本和34个特征的数据集,我想使用一个神经网络来预测keras的潜伏期(真实值),该模型有3个隐藏层,每层有1024个神经元,我对每个隐藏层使用了drop_out(50%)和l2正则化(0.001)。问题是我得到的测试平均绝对误差为3.5505 ms,训练平均绝对误差为3.4528 ms。在这里,列车误差比测试误差小一个小间隙,这是否意味着我们这里有过拟合问题

如果你的训练集的精确度很高,而测试集的精确度很低,这通常意味着你的训练集的精确度过高。所以在你的情况下-不,你可能不是太合适了


通常,您也会有一个验证集,因此您无法将数据放入测试集

如果你的训练集的精确度很高,而测试集的精确度很低,这通常意味着你的训练集的精确度过高。所以在你的情况下-不,你可能不是太合适了


通常,您也会有一个验证集,因此您无法将数据放入测试集

不太可能,但看看您的模型如何推广到新数据始终是一个好主意

将原始数据集的10%-20%作为测试集,并尝试预测测试集中每个记录的输出

有时,当我们在多次尝试改进模型时处理相同的验证集时,我们往往也会过度拟合评估数据集


拥有3个不同的数据集用于培训、评估和测试通常可以提供一个解决过度拟合问题的整体解决方案。

不太可能,但了解模型如何推广到新数据始终是一个好主意

将原始数据集的10%-20%作为测试集,并尝试预测测试集中每个记录的输出

有时,当我们在多次尝试改进模型时处理相同的验证集时,我们往往也会过度拟合评估数据集

有3个不同的数据集用于培训、评估和测试,通常可以提供一个完整的过度拟合解决方案