Machine learning 为什么我们使用RMSE而不是平均残差作为模型的评估标准?
通常,我们使用RMSE来评估模型的性能。我很好奇为什么我们用平均残差来代替RMSE RMSE的定义: 此处提到的平均残差为: 例如: 我们有三个样品:0 1 2 这些样本的预测值为:0 2 10 所以平均残差是 RMSE是 那么这两个值之间的区别是什么呢?(我将RMSE和“平均残差”称为损失函数)Machine learning 为什么我们使用RMSE而不是平均残差作为模型的评估标准?,machine-learning,statistics,Machine Learning,Statistics,通常,我们使用RMSE来评估模型的性能。我很好奇为什么我们用平均残差来代替RMSE RMSE的定义: 此处提到的平均残差为: 例如: 我们有三个样品:0 1 2 这些样本的预测值为:0 2 10 所以平均残差是 RMSE是 那么这两个值之间的区别是什么呢?(我将RMSE和“平均残差”称为损失函数) 请注意,您为“平均残差”给出的表达式可以有正值、零值和负值,并且它不受下面的限制。这不是损失函数的一个好特性,它应该有一个与其最佳值对应的下限(通常为零)。如果你试图最小化这个函数,你实际上是在训练你
RMSE除了是一个凸函数外,还与高斯分布密切相关,因为RMSE的表达式与正态分布的标准偏差类似
正态分布被很好地研究,并自然地出现在自然科学中发现的各种随机过程中。将误差等同于正态分布的扩散在许多情况下都很有用,例如对数似然()、对数后验(查看证据近似幻灯片)优化等。是的,平均残差应使用绝对值。谢谢你的回答,我知道了^_^