R或Stata中分类变量的自举比例
我需要在R或Stata软件中进行引导的帮助。我想计算那些对某项政策的有效性表示赞成和反对的人的比例 在Stata我有这个代码R或Stata中分类变量的自举比例,r,stata,statistics-bootstrap,R,Stata,Statistics Bootstrap,我需要在R或Stata软件中进行引导的帮助。我想计算那些对某项政策的有效性表示赞成和反对的人的比例 在Stata我有这个代码 bs "summarize y1" "r(mean)", reps(200) size(770) 估算比例时,r(平均值)的值应该是多少 此外,我在R中有以下代码: test <- function (q13){ test13 <- table(q13) rel_freq <- test13/sum(test13) return
bs "summarize y1" "r(mean)", reps(200) size(770)
估算比例时,r(平均值)
的值应该是多少
此外,我在R中有以下代码:
test <- function (q13){
test13 <- table(q13)
rel_freq <- test13/sum(test13)
return(rel_freq)
}
results <- boot(data=q13, statistic=test,
R=200)
test在Stata中,如果一个变量有两个以上的类别,则可以使用比例
:
//样本数据
sysuse auto, clear
keep if (headroom==2.0 |headroom==2.5)
gen prop=.
replace prop=0 if headroom==2.0
replace prop=1 if headroom==2.5
//说0是肯定的,1是否定的
set seed 123
bootstrap _b, reps(100):proportion prop
根据@Nick更新:对于二进制变量,以下内容就足够了
bootstrap r(mean), reps(100): summarize prop, meanonly
在R中,您可以使用boot
软件包和mtcars数据执行以下操作:
library(boot)
set.seed(123)
x<-mtcars$vs
myprop<-function(x,i){
sum(x[i]==0)/length(x)
}
bootprop <- boot(x,myprop,100)
库(启动)
种子集(123)
对于R,请仔细阅读?boot
中的示例-您的函数test
需要至少获取两个参数,其中第二个参数应该是一组用于对基础数据重新采样的索引。如果变量是二进制的,则在Statasummary中,meanonly
将1的比例返回为R(平均值)
。感谢Nick Cox和@Metrics!我运行R代码,但我没有得到结果。我收到了“Bootstrap Statistics:WARNING:t1*的所有值都是NA”,这是我想要进行Bootstrap的示例数据摘要。数据缺少值。我不确定这是否会影响结果。>描述(q10testfactor)q10testfactor n缺失唯一的254 516 2 0(58,23%),1(196,77%)这很奇怪。我将R值增加到R=5000。我得到了标准误差的值,但估计值仍然为NA。调用:boot(data=x,statistic=myprop,R=5000)Bootstrap Statistics:original bias std.error t1*NA NA 0.01670186当然,您必须首先处理丢失的数据,因为您是从数据中采样的。您是否使用了Stata
?谢谢!:-我不知道怎么做。但现在我知道了。谢谢