R N个独立标准正态变量之和

R N个独立标准正态变量之和,r,R,我想模拟N个独立的标准正态变量之和 sums <- c(1:5000) for (i in 1:5000) { sums[i] <- sum(rnorm(5000,0,1)) } 模拟的期望值太大。当我再次尝试时,我得到了1.309206的平均值。@ilir是正确的,你得到的值基本上是零。 如果查看绘图,将得到介于-200和200之间的值。0.42适用于所有目的 你可以用t检验 如果零假设成立,没有证据表明你的平均值与零不同。@ilir是正确的,你得到的值本质上是零。 如果查

我想模拟N个独立的标准正态变量之和

sums <- c(1:5000)

for (i in 1:5000) {
  sums[i] <- sum(rnorm(5000,0,1))
}

模拟的期望值太大。当我再次尝试时,我得到了1.309206的平均值。

@ilir是正确的,你得到的值基本上是零。 如果查看绘图,将得到介于-200和200之间的值。0.42适用于所有目的

你可以用t检验


如果零假设成立,没有证据表明你的平均值与零不同。

@ilir是正确的,你得到的值本质上是零。 如果查看绘图,将得到介于-200和200之间的值。0.42适用于所有目的

你可以用t检验


如果零假设为真,没有证据表明你的平均值与零不同。

这是很正常的,平均值没有精确地落在0上,因为它是一个经验平均值,仅从5000个随机变量的实现计算得出

但是,sumsvector中包含的实现分布应该是高斯分布


例如,当我试图绘制直方图和qqplot时,通过这种方式创建的5000个高斯定律之和的10000个实现值:sums这是很正常的,平均值不精确地落在0上,因为它是仅从5000个随机变量实现值计算出的经验平均值

但是,sumsvector中包含的实现分布应该是高斯分布


例如,当我试图绘制直方图和qqplot时,通过这种方式创建的5000个高斯定律之和的10000个实现获得:求和独立法线之和再次是正态的,平均值和方差之和是方差之和。所以sumrnorm5000,0,1相当于rnorm1,0,sqrt5000。法线的样本平均值也是法线变量。在你的例子中,你取5000个独立正态变量的样本平均值,平均值为零,方差为5000。这是一个均值和单位方差为零的正态变量,即标准正态


所以在你的例子中,均值和等于rnorm1。因此,区间-1.96,1.96中的任何值在95%的时间内都会出现。

独立正态和再次是正态的,平均值是平均值的和,方差是方差的和。所以sumrnorm5000,0,1相当于rnorm1,0,sqrt5000。法线的样本平均值也是法线变量。在你的例子中,你取5000个独立正态变量的样本平均值,平均值为零,方差为5000。这是一个均值和单位方差为零的正态变量,即标准正态


所以在你的例子中,均值和等于rnorm1。因此,区间-1.96,1.96的任何值都将在95%的时间内出现。

对我来说似乎是一个合理的结果。当你认为方差渐近接近5000时,期望值本质上是0。也许你是对的。。。但是平均值不应该也接近于零吗?我希望平均值会比我的模拟值更接近于零,例如,我在一次特定尝试中得到了1.309。在你的例子中,标准化随机变量的平均值是0.426/sqrt5032.494。这是0:-注意,独立正态变量之和也是正态的。所以sumrnorm5000,0,1相当于rnorm1,0,sqrt5000。对我来说似乎是一个合理的结果。当你认为方差渐近接近5000时,期望值本质上是0。也许你是对的。。。但是平均值不应该也接近于零吗?我希望平均值会比我的模拟值更接近于零,例如,我在一次特定尝试中得到了1.309。在你的例子中,标准化随机变量的平均值是0.426/sqrt5032.494。这是0:-注意,独立正态变量之和也是正态的。所以sumrnorm5000,0,1相当于rnorm1,0,sqrt5000。
> mean(sums)
[1] 0.4260789
> var(sums)
[1] 5032.494
> t.test(sums, mu = 0)

    One Sample t-test

data:  sums
t = -1.1869, df = 4999, p-value = 0.2353
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 -3.167856  0.778563
sample estimates:
mean of x 
-1.194646 
hist(sums)
qqnorm(sums)