Machine learning K-折叠交叉验证和样本外交叉验证_Machine Learning_Statistics_Data Science_Data Analysis_Cross Validation

Machine learning K-折叠交叉验证和样本外交叉验证

machine-learning statistics

Machine learning K-折叠交叉验证和样本外交叉验证,machine-learning,statistics,data-science,data-analysis,cross-validation,Machine Learning,Statistics,Data Science,Data Analysis,Cross Validation,K倍交叉验证和样本外交叉验证之间有什么区别？你能用几句话来描述每个CV方法的步骤吗？K-fold交叉验证是一种样本外交叉验证。样本外的名称来自以下事实：如果我们拟合模型并计算训练集上的均方误差，我们将得到一个乐观的有偏评估，评估模型拟合独立数据集的程度。这种有偏估计称为样本内拟合估计，我们将使用训练样本，而交叉验证估计是样本外估计在k-折叠交叉验证中，原始样本被随机划分为k个大小相等的子样本。在k个子样本中，保留一个子样本作为模型测试的验证数据，剩余的k个子样本作为模型测试的验证数据− 1子样

K倍交叉验证和样本外交叉验证之间有什么区别？你能用几句话来描述每个CV方法的步骤吗？

K-fold交叉验证是一种样本外交叉验证。样本外的名称来自以下事实：如果我们拟合模型并计算训练集上的均方误差，我们将得到一个乐观的有偏评估，评估模型拟合独立数据集的程度。这种有偏估计称为样本内拟合估计，我们将使用训练样本，而交叉验证估计是样本外估计

在k-折叠交叉验证中，原始样本被随机划分为k个大小相等的子样本。在k个子样本中，保留一个子样本作为模型测试的验证数据，剩余的k个子样本作为模型测试的验证数据− 1子样本用作训练数据。交叉验证过程重复k次，每个k个子样本仅使用一次作为验证数据。然后，可以对k个结果进行平均以产生单个估计。与重复随机子抽样相比，该方法的优势在于，所有观察均用于训练和验证，且每个观察仅用于验证一次

对于其他方法，你可以查看维基百科，那里有精辟的总结：

不同的名字基本上是一样的，我记得我不确定。您可以在本文中查看各种CV方法：