R 为什么从glmnet模型中获取回归系数的统计汇总信息是不可取的?
我有一个二元结果的回归模型。我用glmnet对模型进行了拟合,得到了选定的变量及其系数 由于glmnet不计算变量的重要性,我想将精确的输出(选定的变量及其系数)提供给glm,以获得信息(标准误差等) 我搜索了r文档,似乎可以使用glm中的“方法”选项来指定用户定义的函数。 但我没能做到,有人能帮我吗 “要求回归的标准误差是一个非常自然的问题 系数或其他估算量。原则上,此类标准 可以很容易地计算错误,例如使用引导 尽管如此,这个方案还是故意不提供它们 这是因为标准错误对于强错误来说不是很有意义 有偏差的估计,如由惩罚估计方法产生的估计。 惩罚估计是一种减少方差的过程 引入实质性偏差的估计量。每个估计量的偏差 因此,是其均方误差的主要组成部分,而 差异可能只占一小部分 不幸的是,在惩罚回归的大多数应用中,它是 无法获得足够精确的偏差估计值。任何 基于bootstrap的计算只能评估 估计值的方差。偏差的可靠估计值仅为 如果可靠的无偏估计可用,则可用,即 通常情况下,不适用于惩罚估计的情况 用过 因此,报告惩罚估计的标准误差可以说明 这只是故事的一部分。它可能会给人一种错误的印象 精确性,完全忽略偏差造成的不精确性 做出仅限于 基于对估计方差的评估,例如 基于bootstrap的置信区间可以。” 有CRAN软件包,为高维模型提供推理,您可能想看看这些。。。R 为什么从glmnet模型中获取回归系数的统计汇总信息是不可取的?,r,statistics,regression,glm,glmnet,R,Statistics,Regression,Glm,Glmnet,我有一个二元结果的回归模型。我用glmnet对模型进行了拟合,得到了选定的变量及其系数 由于glmnet不计算变量的重要性,我想将精确的输出(选定的变量及其系数)提供给glm,以获得信息(标准误差等) 我搜索了r文档,似乎可以使用glm中的“方法”选项来指定用户定义的函数。 但我没能做到,有人能帮我吗 “要求回归的标准误差是一个非常自然的问题 系数或其他估算量。原则上,此类标准 可以很容易地计算错误,例如使用引导 尽管如此,这个方案还是故意不提供它们 这是因为标准错误对于强错误来说不是很有意义
我还看到人们只是使用
glmnet
选择的预测器运行glm
,但这没有考虑到最佳模型本身的选择过程所产生的不确定性…请重复示例?我现在没有一个例子,但是,把问题简化一点。假设我有一个从glmnet输出的公式,y=2.3*x1+3.1*x2+0.9*x3。我如何在glm中指定这个公式,以便对其进行操作?这是不可复制的,但它给了我一个更好的想法。我认为您可能无法做您想要做的事情:也就是说,您可以通过将一个完全指定的模型指定为偏移项来向glm提供该模型,但我不确定它是否可以从该起点计算变量的重要性。您是否考虑过使用插入符号
软件包,该软件包通过对不同模型进行平均来实现某种形式的收缩,并提供有关变量重要性的信息?我将查看“插入符号”,您还可以帮助我了解如何在glm中使用偏移项的一些来源吗?请参阅?glm
。不过,我真的不认为偏移量对你有用。如果你给出一个可复制的例子,也许其他人会插话。很好地解释了为什么不提供S.E!