R 为什么从glmnet模型中获取回归系数的统计汇总信息是不可取的?

R 为什么从glmnet模型中获取回归系数的统计汇总信息是不可取的?,r,statistics,regression,glm,glmnet,R,Statistics,Regression,Glm,Glmnet,我有一个二元结果的回归模型。我用glmnet对模型进行了拟合,得到了选定的变量及其系数 由于glmnet不计算变量的重要性,我想将精确的输出(选定的变量及其系数)提供给glm,以获得信息(标准误差等) 我搜索了r文档,似乎可以使用glm中的“方法”选项来指定用户定义的函数。 但我没能做到,有人能帮我吗 “要求回归的标准误差是一个非常自然的问题 系数或其他估算量。原则上,此类标准 可以很容易地计算错误,例如使用引导 尽管如此,这个方案还是故意不提供它们 这是因为标准错误对于强错误来说不是很有意义

我有一个二元结果的回归模型。我用glmnet对模型进行了拟合,得到了选定的变量及其系数

由于glmnet不计算变量的重要性,我想将精确的输出(选定的变量及其系数)提供给glm,以获得信息(标准误差等)

我搜索了r文档,似乎可以使用glm中的“方法”选项来指定用户定义的函数。 但我没能做到,有人能帮我吗

“要求回归的标准误差是一个非常自然的问题 系数或其他估算量。原则上,此类标准 可以很容易地计算错误,例如使用引导

尽管如此,这个方案还是故意不提供它们 这是因为标准错误对于强错误来说不是很有意义 有偏差的估计,如由惩罚估计方法产生的估计。 惩罚估计是一种减少方差的过程 引入实质性偏差的估计量。每个估计量的偏差 因此,是其均方误差的主要组成部分,而 差异可能只占一小部分

不幸的是,在惩罚回归的大多数应用中,它是 无法获得足够精确的偏差估计值。任何 基于bootstrap的计算只能评估 估计值的方差。偏差的可靠估计值仅为 如果可靠的无偏估计可用,则可用,即 通常情况下,不适用于惩罚估计的情况 用过

因此,报告惩罚估计的标准误差可以说明 这只是故事的一部分。它可能会给人一种错误的印象 精确性,完全忽略偏差造成的不精确性 做出仅限于 基于对估计方差的评估,例如 基于bootstrap的置信区间可以。”

有CRAN软件包,为高维模型提供推理,您可能想看看这些。。。
我还看到人们只是使用
glmnet
选择的预测器运行
glm
,但这没有考虑到最佳模型本身的选择过程所产生的不确定性…

请重复示例?我现在没有一个例子,但是,把问题简化一点。假设我有一个从glmnet输出的公式,y=2.3*x1+3.1*x2+0.9*x3。我如何在glm中指定这个公式,以便对其进行操作?这是不可复制的,但它给了我一个更好的想法。我认为您可能无法做您想要做的事情:也就是说,您可以通过将一个完全指定的模型指定为偏移项来向glm提供该模型,但我不确定它是否可以从该起点计算变量的重要性。您是否考虑过使用
插入符号
软件包,该软件包通过对不同模型进行平均来实现某种形式的收缩,并提供有关变量重要性的信息?我将查看“插入符号”,您还可以帮助我了解如何在glm中使用偏移项的一些来源吗?请参阅
?glm
。不过,我真的不认为偏移量对你有用。如果你给出一个可复制的例子,也许其他人会插话。很好地解释了为什么不提供S.E!