SAS stdi输出澄清

SAS stdi输出澄清,sas,statistics,Sas,Statistics,我正在尝试将一些旧的SAS宏转换为Python,但SAS中使用的一些术语有点不清楚。在宏中,PROC语句是 proc reg data=model_file; model &y = &x; output out=&outfile r=resid stdi=resid_error; 我理解r表示每个数据点的个体剩余量,但不清楚stdi的含义。根据SAS手册,stdi表示“单个预测值的标准误差”,因此数据集中每行有一个stdi。我搜索了一下,发现了这个,我相信它解释了如何计

我正在尝试将一些旧的SAS宏转换为Python,但SAS中使用的一些术语有点不清楚。在宏中,PROC语句是

proc reg data=model_file;
model &y = &x;
output out=&outfile r=resid stdi=resid_error;
我理解
r
表示每个数据点的个体剩余量,但不清楚
stdi
的含义。根据SAS手册,stdi表示“单个预测值的标准误差”,因此数据集中每行有一个stdi。我搜索了一下,发现了这个,我相信它解释了如何计算stdi

但是,还有两个(编辑:一个)问题:

  • 是计算个体标准误差的方法 讲座幻灯片中的预测是否正确?我从没见过这个 方法之前,所以我仍然有我的怀疑。我查阅了SAS手册,但是他们对STDI的定义有点混乱:。具体来说,h(i)被定义为,但我不知道[X'X]后面的横条是什么意思

  • 计算单个预测的标准误差的方法 这里使用
    x
    。但是,如果您运行了一个 具有多个X列的回归?stdi是否只假设 单X列


  • 回答:答案是否定的。你可以有多个X列,但仍然有一个STDI值。

    我不是统计学家,你的问题可以包含更多的细节,但快速的谷歌搜索表明你正在寻找一个PROC REG。PROC REG的主要文档如下:

    还有专门的“模型拟合和诊断统计”页面,包括此处的相关公式:


    也许这会回答你的问题。虽然我对这些东西不感兴趣,但我相信SAS的文档非常擅长描述每个过程所进行的精确计算。

    感谢您的回复。您认为在我的问题中包含哪些其他细节对我有帮助,以便为回答者提供更多指导?在这种情况下,显示更多您正在转换为Python的SAS代码会很有帮助。“SAS中使用的术语”的解释很可能因您所查看的进程而异。添加诸如“我在哪里可以找到文档?”或“我在这里查看了文档,但它没有回答我的问题”之类的内容也很有帮助,这样我们就不会浪费时间执行您可能已经尝试过的明显步骤。我仔细阅读了SAS的文档,但是他们对STDI的定义还不清楚——我已经进一步解释了在编辑我的问题时我到底在哪里感到困惑。