Machine learning 如何量化给定训练数据样本的偏差和方差

Machine learning 如何量化给定训练数据样本的偏差和方差,machine-learning,statistics,linear-regression,Machine Learning,Statistics,Linear Regression,我有一个使用多项式和径向基函数训练的模型,我将数据分为训练集和测试集,并从训练集中采集大量样本。现在我对下一步感到茫然,我知道偏差是样品的损失最小。我是根据列车数据还是测试数据计算?方差仅仅是测试集上损失的方差吗?此折衷的主要目标是为决策边界找到适当的复杂性 高复杂性:(可能)记忆过去,但(可能)不能概括未来(高方差问题) 低复杂性:(无法)从过去学到足够的东西,因为决策边界非常简单,而且(可能)也无法做出良好的预测(高偏差问题) 这可以简单地用如下图来表示 您似乎对基本统计术语感到困惑。堆栈溢

我有一个使用多项式和径向基函数训练的模型,我将数据分为训练集和测试集,并从训练集中采集大量样本。现在我对下一步感到茫然,我知道偏差是样品的损失最小。我是根据列车数据还是测试数据计算?方差仅仅是测试集上损失的方差吗?

此折衷的主要目标是为决策边界找到适当的复杂性

高复杂性:(可能)记忆过去,但(可能)不能概括未来(高方差问题)

低复杂性:(无法)从过去学到足够的东西,因为决策边界非常简单,而且(可能)也无法做出良好的预测(高偏差问题)

这可以简单地用如下图来表示


您似乎对基本统计术语感到困惑。堆栈溢出更关注于编码问题,请看一看。寻找一个关于偏差/方差权衡的好教程,应该有很多。谢谢你的回答,但是我正在寻找一种方法,给偏差一个数字,给方差一个数字,以显示哪些模型对数字是好的,哪些是坏的。