Machine learning K-折叠交叉验证和样本外交叉验证

Machine learning K-折叠交叉验证和样本外交叉验证,machine-learning,statistics,data-science,data-analysis,cross-validation,Machine Learning,Statistics,Data Science,Data Analysis,Cross Validation,K倍交叉验证和样本外交叉验证之间有什么区别?你能用几句话来描述每个CV方法的步骤吗?K-fold交叉验证是一种样本外交叉验证。样本外的名称来自以下事实:如果我们拟合模型并计算训练集上的均方误差,我们将得到一个乐观的有偏评估,评估模型拟合独立数据集的程度。这种有偏估计称为样本内拟合估计,我们将使用训练样本,而交叉验证估计是样本外估计 在k-折叠交叉验证中,原始样本被随机划分为k个大小相等的子样本。在k个子样本中,保留一个子样本作为模型测试的验证数据,剩余的k个子样本作为模型测试的验证数据− 1子样

K倍交叉验证和样本外交叉验证之间有什么区别?你能用几句话来描述每个CV方法的步骤吗?

K-fold交叉验证是一种样本外交叉验证。样本外的名称来自以下事实:如果我们拟合模型并计算训练集上的均方误差,我们将得到一个乐观的有偏评估,评估模型拟合独立数据集的程度。这种有偏估计称为样本内拟合估计,我们将使用训练样本,而交叉验证估计是样本外估计

在k-折叠交叉验证中,原始样本被随机划分为k个大小相等的子样本。在k个子样本中,保留一个子样本作为模型测试的验证数据,剩余的k个子样本作为模型测试的验证数据− 1子样本用作训练数据。交叉验证过程重复k次,每个k个子样本仅使用一次作为验证数据。然后,可以对k个结果进行平均以产生单个估计。与重复随机子抽样相比,该方法的优势在于,所有观察均用于训练和验证,且每个观察仅用于验证一次


对于其他方法,你可以查看维基百科,那里有精辟的总结:

不同的名字基本上是一样的,我记得我不确定。您可以在本文中查看各种CV方法: