R 如何使用调查使用重复权重分析美国住房调查数据

R 如何使用调查使用重复权重分析美国住房调查数据,r,survey,R,Survey,我正在分析来自美国住房调查的数据,该调查附带了复制权重以计算正确的标准误差,在R中包含调查,但我想确保我正确指定了设计 我是这样做的: svy <- svrepdesign(data = ahs, weight = ~WEIGHT, repweights = "REPWEIGHT[0-9]+", type = "Fay", rho = 0.

我正在分析来自美国住房调查的数据,该调查附带了复制权重以计算正确的标准误差,在R中包含
调查
,但我想确保我正确指定了设计

我是这样做的:

svy <- svrepdesign(data = ahs,
                   weight = ~WEIGHT,
                   repweights = "REPWEIGHT[0-9]+",
                   type = "Fay",
                   rho = 0.5,
                   scale = 4/160,
                   rscales = rep(1, 160),
                   mse = TRUE)
忘了权重变量的名称吧,它在2015年刚刚发生了变化(大概是在他写了那个网页之后),他和我做的一样,只是他没有指定
scale
rscales
。根据我上面的解释和
调查
的文档,我觉得他应该像我一样指定它们,但我以前从未在
调查
中使用过复制权重,所以我想确定一下

另外,我发现更奇怪的是,当我试图不指定
scale
rscales
时,我计算的标准误差似乎与我计算时的相同。这意味着在实践中我如何做可能无关紧要,但由于如果我指定
scale
rscales
,则用于计算标准误差的公式应该是不同的,因此我仍然想理解为什么它似乎不会影响
调查所计算的标准误差


p.S.bis:另一件事我不明白的是,尽管人口普查局说它使用了费伊的方法,并建议使用SAS程序,这将导致费伊系数
0.5
,但它发布的指南中给出的标准误差公式中似乎没有任何费伊系数。这意味着,如果我要编写自己的代码来使用该公式计算标准误差,那么结果可能会不同于我使用
调查
时,使用
rho
0.5
或人口普查局推荐的SAS程序来计算标准误差,这对我来说没有多大意义。

svrepdesign
不需要Fay复制权重的
scale
rscales
参数,因为它可以自己计算权重。这就是知道权重的
类型的意义所在。我可能应该为您指定它们时添加一个警告

公式中不需要明确的费伊系数。构建权重时,将采样权重乘以
2-rho
rho
,以获得重复权重。这一切都完成了。现在你只需要知道如何缩放残差的平方。人口普查局公式(链接的p6)的乘数为4/160。这4是
1/(1-rho)^2
——安东尼·达米科的代码进行了反向转换,从
4
计算出
rho=0.5


直截了当的BRR的乘数应该是1/160而不是4/160。

谢谢,这回答了我的问题,也解释了为什么Anthony Damico那样写
rho
,这也是我想知道的另一件事。
ahs_design <- 
    svrepdesign(
        weights = ~ wgt90geo ,
        repweights = "repwgt[1-9]" ,
        type = "Fay" ,
        rho = ( 1 - 1 / sqrt( 4 ) ) ,
        mse = TRUE ,
        data = ahs_df
    )