R?

R?,r,statistics,probability,confidence-interval,R,Statistics,Probability,Confidence Interval,我知道我需要mean和s.d来找到间隔,但是,如果问题是: 在对1000名随机选择的工人进行的调查中,520名是女性。根据调查结果,为女性员工比例设定95%的置信区间 我如何找到它的平均值和s.d?在这种情况下,你有二项分布,所以你要计算 在R中,您可以从包Hmisc > binconf(x=520, n=1000) PointEst Lower Upper 0.52 0.4890177 0.5508292 或者你可以自己计算: > p <- 52

我知道我需要mean和s.d来找到间隔,但是,如果问题是:

在对1000名随机选择的工人进行的调查中,520名是女性。根据调查结果,为女性员工比例设定95%的置信区间


我如何找到它的平均值和s.d?

在这种情况下,你有二项分布,所以你要计算

在R中,您可以从包
Hmisc

> binconf(x=520, n=1000)
 PointEst     Lower     Upper
     0.52 0.4890177 0.5508292
或者你可以自己计算:

> p <- 520/1000
> p + c(-qnorm(0.975),qnorm(0.975))*sqrt((1/1000)*p*(1-p))
[1] 0.4890345 0.5509655
p p+c(-qnorm(0.975),qnorm(0.975))*sqrt((1/1000)*p*(1-p)) [1] 0.4890345 0.5509655
您还可以使用软件包
stats
中的
prop.test
,或
binom.test

prop.test(x, n, conf.level=0.95, correct = FALSE)

        1-sample proportions test without continuity correction

data:  x out of n, null probability 0.5
X-squared = 1.6, df = 1, p-value = 0.2059
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
 0.4890177 0.5508292
sample estimates:
   p 
0.52 

您可能会发现有趣的是,在第861页的表1中,针对单个比例给出了不同的置信区间,使用七种方法计算(针对选定的n和r组合)。使用
prop.test
可以获得表格第3行和第4行中的结果,而
binom.test
返回第5行中的结果。

或者,使用
流行率
包中的函数
propCI
,获得五个最常用的二项置信区间:

> library(prevalence)
> propCI(x = 520, n = 1000)
    x    n    p        method level     lower     upper
1 520 1000 0.52 agresti.coull  0.95 0.4890176 0.5508293
2 520 1000 0.52         exact  0.95 0.4885149 0.5513671
3 520 1000 0.52      jeffreys  0.95 0.4890147 0.5508698
4 520 1000 0.52          wald  0.95 0.4890351 0.5509649
5 520 1000 0.52        wilson  0.95 0.4890177 0.5508292

另一个软件包:
tolerance
将计算一吨典型分布函数的置信度/公差范围。

你可以用
qnorm(0.975)
如果你使用99%置信区间,q-norm会是什么?
qnorm(0.99)
是2.326348也许看看这里发布的答案:回答不错,而且它不需要任何外部软件包。@Late Mail这可能是一个愚蠢的问题,但你如何将95%的CI转化为SE和SD?哇,这个软件包
公差
是全面而彻底的。优秀推荐!