Svyglm在R中的包内调查未返回Std错误
我真的很感谢你在这方面的帮助。我想估算一个glm的系数和95%CI,该glm应用于两个级别的家庭调查(由dd和hh.num1定义)。我只是最近才看到了一揽子调查Svyglm在R中的包内调查未返回Std错误,r,survey,standard-error,R,Survey,Standard Error,我真的很感谢你在这方面的帮助。我想估算一个glm的系数和95%CI,该glm应用于两个级别的家庭调查(由dd和hh.num1定义)。我只是最近才看到了一揽子调查 我已经在VIGETE中遵循了1个示例:设置一个数据集来考虑采样方法——使用SyyDebug 2)使用命令SyyGLM建立一个GLM。对于示例数据集: library(survey)data(api)head(apiclus1)dclus1 <- svydesign(id = ~dnum, weights = ~pw, data =
我已经在VIGETE中遵循了1个示例:设置一个数据集来考虑采样方法——使用SyyDebug 2)使用命令SyyGLM建立一个GLM。对于示例数据集:
library(survey)data(api)head(apiclus1)dclus1 <- svydesign(id = ~dnum, weights = ~pw, data = apiclus1)logitmodel <-svyglm(I(sch.wide=="Yes")~awards+comp.imp+enroll+target+hsg+pct.resp+mobility+ell+meals, design=dclus1, family=quasibinomial())summary(logitmodel)
library(survey)data(api)head(apiclus1)dclus1问题在于模型中的剩余自由度为零。剩余df是设计df(PSU的数量减去地层的数量)减去预测值的数量,当每个地层有两个大簇时,预测值很容易变为负值。剩余df的定义可能是保守的,但这不是一个简单的问题
> degf(dclus1)
[1] 5
> glm1$df.resid
[1] 0
您可以使用提取标准错误
> SE(glm1)
(Intercept) factor(MN18c)2 factor(MN18c)3 factor(MN18c)4 windex5
0.5461374 0.4655331 0.2805168 0.3718879 0.1376936
age.y
0.1638210
如果您愿意使用不同的剩余自由度,您可以将其指定为summary
并获得$p$-值。特别是,如果没有一个协变量在集群级别,那么有一个合理的理由认为回归没有使用自由度,因此每次可以使用一个参数
> summary(glm1, df=degf(dclus1))
Call:
svyglm(formula = out.penta ~ factor(MN18c) + windex5 + age.y,
design = dclus1, family = quasibinomial())
Survey design:
svydesign(id = ~dd + hh.num1, weights = ~chweight, data = balo2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -3.0848 0.5461 -5.648 0.00241 **
factor(MN18c)2 -0.1183 0.4655 -0.254 0.80957
factor(MN18c)3 -0.4908 0.2805 -1.750 0.14059
factor(MN18c)4 -0.6137 0.3719 -1.650 0.15981
windex5 0.2556 0.1377 1.856 0.12256
age.y 0.9934 0.1638 6.064 0.00176 **
组合参数(例如测试构成MN18c
的三个系数)问题更大,我认为您至少需要df=degf(clus1)-3+1
在即将发布的版本4.1中,包将报告这种情况下的标准错误(但不是$p$-值,除非指定了不同的df=
)hi,load(“balo2_7March17.Rdat”)错误:错误的还原文件幻数(文件可能已损坏)--除此之外,未加载任何数据:警告消息:文件“balo2_7March17.Rdat”具有幻数“”不推荐使用2之前的保存版本
Hi@Kath O'Reilly是否能够解决此问题?
> summary(glm1, df=degf(dclus1))
Call:
svyglm(formula = out.penta ~ factor(MN18c) + windex5 + age.y,
design = dclus1, family = quasibinomial())
Survey design:
svydesign(id = ~dd + hh.num1, weights = ~chweight, data = balo2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -3.0848 0.5461 -5.648 0.00241 **
factor(MN18c)2 -0.1183 0.4655 -0.254 0.80957
factor(MN18c)3 -0.4908 0.2805 -1.750 0.14059
factor(MN18c)4 -0.6137 0.3719 -1.650 0.15981
windex5 0.2556 0.1377 1.856 0.12256
age.y 0.9934 0.1638 6.064 0.00176 **