Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/jenkins/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Stata确定svy回归后有影响的观察结果_Stata_Survey_Outliers - Fatal编程技术网

Stata确定svy回归后有影响的观察结果

Stata确定svy回归后有影响的观察结果,stata,survey,outliers,Stata,Survey,Outliers,使用Stata svy命令时,例如: svy: logistic graduate age female i.math i.english 应该完成各种后续步骤。例如,寻找显著的异常值或高杠杆率点。如果没有“svy”元素,以下命令将起作用: predict p predict stdres, rstand scatter stdres p, mlabel(snum) ylab(-4(2) 16) yline(0) 但是,当使用svy前言运行逻辑回归时,只会产生以下错误: svy估算后不允许使

使用Stata svy命令时,例如:

svy: logistic graduate age female i.math i.english
应该完成各种后续步骤。例如,寻找显著的异常值或高杠杆率点。如果没有“svy”元素,以下命令将起作用:

predict p
predict stdres, rstand
scatter stdres p, mlabel(snum) ylab(-4(2) 16) yline(0)
但是,当使用
svy
前言运行逻辑回归时,只会产生以下错误:

svy估算后不允许使用选项标准


太好了。什么是允许的?有人是如何看待显著的异常值或高杠杆率点的?

@NickCox的评论是正确的——在将诊断扩展到复杂的调查设置方面没有做多少工作。其中一个原因是,从技术上讲,调查推断是非参数的:推断的对象不是变量之间的某种理想化关系,而是人口普查回归,以及全体人口可能具有的所有“异常值”。不可能受到异常值的严重影响;这里只有估计方程,标准误差无论如何都是“稳健的”(即使用三明治公式而不是黑森公式)

那里的工作大部分是由Rick Valliant完成的(R包
svydiags
:,他的学生李建柱的论文:我现在找不到该论文发表的一些后续论文。)


(这一切更像是对交叉验证/stats的讨论,而不是对SO/Stata的讨论。)

帮助logit postestimation
详细说明了什么是允许的,什么是不允许的。我的猜测是,这些后评估技术中有一小部分在理论上从未用于调查权重。(以上“前言”应为“前缀”。