SAS Proc GlmSelect-如何使用交叉验证获得参数估计值

SAS Proc GlmSelect-如何使用交叉验证获得参数估计值,sas,cross-validation,Sas,Cross Validation,我一直在使用Proc GlmSelect和交叉验证功能,因为我的样本量相当小 我根据CVPRESS预测的最小误差和选择模型。输出生成所有变量的最终参数估计,以及每个交叉验证和变量的参数估计 但是,最终参数估计值不等于平均值,也不等于加权平均值,其中I根据测试集或验证集的大小进行加权 我已经浏览了很多SAS指令,但是我找不到任何解释,说明最终参数估计是如何从不同的交叉验证中得出的 我会非常感激能给我一个正确的答案或指引我前进方向的东西 Br,我认为,你的问题实际上指向了交叉验证的本质,而不是PRO

我一直在使用Proc GlmSelect和交叉验证功能,因为我的样本量相当小

我根据CVPRESS预测的最小误差和选择模型。输出生成所有变量的最终参数估计,以及每个交叉验证和变量的参数估计

但是,最终参数估计值不等于平均值,也不等于加权平均值,其中I根据测试集或验证集的大小进行加权

我已经浏览了很多SAS指令,但是我找不到任何解释,说明最终参数估计是如何从不同的交叉验证中得出的

我会非常感激能给我一个正确的答案或指引我前进方向的东西


Br,

我认为,你的问题实际上指向了交叉验证的本质,而不是PROC-GLMSELECT。最终估计值不是交叉验证期间拟合的模型估计值的组合-它们之间没有这种关系

这就是为什么:在CV期间,您在不同的数据折叠上拟合不同的模型,即每个模型拟合在不同的数据子集上,并且估计是该数据的最佳解决方案。最终拟合是在我假设的整个样本上估计的。训练数据的差异确实会导致估计值的差异,但你不能期望最终估计值可以从CV拟合中推导出来;只要考虑拟合是通过一个非线性的和通常复杂的函数来执行的。
我的建议是:使用CV拟合来查看系数的分布;将最终的EsitMate与它们进行比较;并检查每个CV模型的性能。这将帮助您评估您的模型及其选择。

啊-是的,这很有意义。甚至可能有点可疑。谢谢你的帮助!不客气。你介意接受这个正确的答案,让其他人知道吗?