Stata确定svy回归后有影响的观察结果_Stata_Survey_Outliers

Stata确定svy回归后有影响的观察结果

stata

Stata确定svy回归后有影响的观察结果,stata,survey,outliers,Stata,Survey,Outliers,使用Stata svy命令时，例如： svy: logistic graduate age female i.math i.english 应该完成各种后续步骤。例如，寻找显著的异常值或高杠杆率点。如果没有“svy”元素，以下命令将起作用： predict p predict stdres, rstand scatter stdres p, mlabel(snum) ylab(-4(2) 16) yline(0) 但是，当使用svy前言运行逻辑回归时，只会产生以下错误： svy估算后不允许使

使用Stata svy命令时，例如：

svy: logistic graduate age female i.math i.english

应该完成各种后续步骤。例如，寻找显著的异常值或高杠杆率点。如果没有“svy”元素，以下命令将起作用：

predict p
predict stdres, rstand
scatter stdres p, mlabel(snum) ylab(-4(2) 16) yline(0)

但是，当使用

svy

前言运行逻辑回归时，只会产生以下错误：

svy估算后不允许使用选项标准

太好了。什么是允许的？有人是如何看待显著的异常值或高杠杆率点的？

@NickCox的评论是正确的——在将诊断扩展到复杂的调查设置方面没有做多少工作。其中一个原因是，从技术上讲，调查推断是非参数的：推断的对象不是变量之间的某种理想化关系，而是人口普查回归，以及全体人口可能具有的所有“异常值”。不可能受到异常值的严重影响；这里只有估计方程，标准误差无论如何都是“稳健的”（即使用三明治公式而不是黑森公式）

那里的工作大部分是由Rick Valliant完成的（R包

svydiags

：，他的学生李建柱的论文：我现在找不到该论文发表的一些后续论文。）

（这一切更像是对交叉验证/stats的讨论，而不是对SO/Stata的讨论。）

帮助logit postestimation

详细说明了什么是允许的，什么是不允许的。我的猜测是，这些后评估技术中有一小部分在理论上从未用于调查权重。（以上“前言”应为“前缀”。