R 如何使用调查使用重复权重分析美国住房调查数据_R_Survey

R 如何使用调查使用重复权重分析美国住房调查数据

R 如何使用调查使用重复权重分析美国住房调查数据,r,survey,R,Survey,我正在分析来自美国住房调查的数据，该调查附带了复制权重以计算正确的标准误差，在R中包含调查，但我想确保我正确指定了设计我是这样做的： svy <- svrepdesign(data = ahs, weight = ~WEIGHT, repweights = "REPWEIGHT[0-9]+", type = "Fay", rho = 0.

我正在分析来自美国住房调查的数据，该调查附带了复制权重以计算正确的标准误差，在R中包含

调查

，但我想确保我正确指定了设计

我是这样做的：

svy <- svrepdesign(data = ahs,
                   weight = ~WEIGHT,
                   repweights = "REPWEIGHT[0-9]+",
                   type = "Fay",
                   rho = 0.5,
                   scale = 4/160,
                   rscales = rep(1, 160),
                   mse = TRUE)

忘了权重变量的名称吧，它在2015年刚刚发生了变化（大概是在他写了那个网页之后），他和我做的一样，只是他没有指定

scale

和

rscales

。根据我上面的解释和

调查

的文档，我觉得他应该像我一样指定它们，但我以前从未在

调查

中使用过复制权重，所以我想确定一下

另外，我发现更奇怪的是，当我试图不指定

scale

和

rscales

时，我计算的标准误差似乎与我计算时的相同。这意味着在实践中我如何做可能无关紧要，但由于如果我指定

scale

和

rscales

，则用于计算标准误差的公式应该是不同的，因此我仍然想理解为什么它似乎不会影响

调查所计算的标准误差
p.S.bis：另一件事我不明白的是，尽管人口普查局说它使用了费伊的方法，并建议使用SAS程序，这将导致费伊系数0.5
，但它发布的指南中给出的标准误差公式中似乎没有任何费伊系数。这意味着，如果我要编写自己的代码来使用该公式计算标准误差，那么结果可能会不同于我使用调查时，使用rho
为0.5
或人口普查局推荐的SAS程序来计算标准误差，这对我来说没有多大意义。
svrepdesign
不需要Fay复制权重的scale
或rscales
参数，因为它可以自己计算权重。这就是知道权重的类型的意义所在。我可能应该为您指定它们时添加一个警告
公式中不需要明确的费伊系数。构建权重时，将采样权重乘以2-rho
或rho
，以获得重复权重。这一切都完成了。现在你只需要知道如何缩放残差的平方。人口普查局公式（链接的p6）的乘数为4/160。这4是1/（1-rho）^2
——安东尼·达米科的代码进行了反向转换，从4
计算出rho=0.5

直截了当的BRR的乘数应该是1/160而不是4/160。
谢谢，这回答了我的问题，也解释了为什么Anthony Damico那样写rho，这也是我想知道的另一件事。
ahs_design <- 
    svrepdesign(
        weights = ~ wgt90geo ,
        repweights = "repwgt[1-9]" ,
        type = "Fay" ,
        rho = ( 1 - 1 / sqrt( 4 ) ) ,
        mse = TRUE ,
        data = ahs_df
    )