预测值的RMSE和MAE优于基准值,但预测值只有一半时间接近实际值
我正在尝试学习一些机器学习的基础知识来预测足球运动员的梦幻足球分数 我建立了一个数据集并做了一些建模。我的计划是将我的预测与梦幻足球专家的预测进行比较 对于我的测试数据,我预测的平均绝对误差=66.2,而专家预测的平均绝对误差=109.3。我对测试集的预测的RMSE=90.2,而专家的预测的RMSE为150.1 我认为这将意味着我的模型预测将始终优于专家预测。然而,情况并非如此。当我观察测试集中的特定个体时,我的模型的预测只有56%的时间超过了专家的预测 有人知道为什么会这样吗?如果是,我能做些什么来解决这个问题预测值的RMSE和MAE优于基准值,但预测值只有一半时间接近实际值,r,machine-learning,R,Machine Learning,我正在尝试学习一些机器学习的基础知识来预测足球运动员的梦幻足球分数 我建立了一个数据集并做了一些建模。我的计划是将我的预测与梦幻足球专家的预测进行比较 对于我的测试数据,我预测的平均绝对误差=66.2,而专家预测的平均绝对误差=109.3。我对测试集的预测的RMSE=90.2,而专家的预测的RMSE为150.1 我认为这将意味着我的模型预测将始终优于专家预测。然而,情况并非如此。当我观察测试集中的特定个体时,我的模型的预测只有56%的时间超过了专家的预测 有人知道为什么会这样吗?如果是,我能做些
(我注意到的一个问题是,我的模型在预测最高得分球员方面做得不好。它比专家们在前5名中的表现都差,虽然在中间层表现得很好。)
< P>这可能是你的模型在数据上过度拟合。这将使您的模型在测试过程中看起来很棒,但在现实生活中它不会精确到新数据。不过,我是使用k-fold交叉验证建模的。(66.2 MAE来自交叉验证模型)我希望这能解决过度拟合的问题。会吗?