通过R2和RMSE比较模型_R_Machine Learning_Regression_Cross Validation

通过R2和RMSE比较模型

r machine-learning

通过R2和RMSE比较模型,r,machine-learning,regression,cross-validation,R,Machine Learning,Regression,Cross Validation,我正在使用pls和h2o包开发模型预测，这将导致两个模型：pls.model和h2o.model。每轮交叉验证的R平方（皮尔逊相关平方）和RMSE如下所示： R2: RMSE：我无法解释为什么pls.model的R2较低但误差较小，而h2o.model的R2较高但误差较大。我检查了散点图，但没有出现非线性模式。你想过这个吗？在这种情况下，更好的模式应该是什么谢谢 Phuong我会将结果解释为H2O可以更好地解释因变量的更多变化，而PLS虽然解释的变化较小，但生成的预测总体上更接近实际值。您

我正在使用pls和h2o包开发模型预测，这将导致两个模型：pls.model和h2o.model。每轮交叉验证的R平方（皮尔逊相关平方）和RMSE如下所示： R2:

RMSE：

我无法解释为什么pls.model的R2较低但误差较小，而h2o.model的R2较高但误差较大。我检查了散点图，但没有出现非线性模式。你想过这个吗？在这种情况下，更好的模式应该是什么

谢谢

Phuong

我会将结果解释为

H2O

可以更好地解释因变量的更多变化，而

PLS

虽然解释的变化较小，但生成的预测总体上更接近实际值。您将从@www:Thank获得更多帮助，那么您将选择哪种模型进行进一步预测？我仍然没有足够的信息。就你的目的而言，是更好地捕捉趋势，还是更重要的是将预测保持在一定范围内？如果是后者，我将使用

pls

。但如果是前者，

h2o

可以解释数据中的重要趋势。请在stats.stackexchange.com上发布可复制的示例数据集和更多信息。此站点用于解决与编程相关的问题，而您的问题不是。@www：我刚刚按照您的建议将问题移至stack.exchange。谢谢。希望对此有更深入的了解。

i     R2.PLS     R2.H2O
1   1 0.4415108 0.6232292
2   2 0.3754088 0.6056992
3   3 0.4267580 0.6204750
4   4 0.3505282 0.6062691
5   5 0.2870766 0.5344183
6   6 0.3858786 0.5794828
7   7 0.3449946 0.5692314
8   8 0.2974582 0.5522208
9   9 0.3446449 0.5694339
10 10 0.3987684 0.5561757

i  rmse.pls rmse.h2o
1   1  8.839967 40.99896
2   2  9.347349 29.94260
3   3  4.240366 14.75890
4   4 17.901563 29.89181
5   5  4.686803 66.04993
6   6 31.717909 10.28799
7   7  2.066342 32.74828
8   8 15.979214 21.05928
9   9 19.454079 10.88551
10 10 27.039400 68.27017