Random 大随机串的正态分布

Random 大随机串的正态分布,random,distribution,probability,random-sample,Random,Distribution,Probability,Random Sample,在编码理论方面,我遇到了一个问题: 从F2,n字段中选择两个随机字符串,即每个位只能取0和1,且字符串长度为n位 现在,我们想知道两个字符串之间不同位数的分布。i、 e.汉明距离 实验表明,它非常接近于0.5,且分布为正态分布。有什么方法可以证明这一点吗 简单的模型是这样的,我投掷两枚硬币n次,然后计算差异的数量,例如0.49n;重复这个实验足够大的k次。这个差值在k上的分布是什么?不同位数是一组自变量的总和,即一个指示变量,如果它们不同,则为1;如果它们相同,则为0,所有这些变量的方差都是有限

在编码理论方面,我遇到了一个问题:

从F2,n字段中选择两个随机字符串,即每个位只能取0和1,且字符串长度为n位

现在,我们想知道两个字符串之间不同位数的分布。i、 e.汉明距离

实验表明,它非常接近于0.5,且分布为正态分布。有什么方法可以证明这一点吗


简单的模型是这样的,我投掷两枚硬币n次,然后计算差异的数量,例如0.49n;重复这个实验足够大的k次。这个差值在k上的分布是什么?

不同位数是一组自变量的总和,即一个指示变量,如果它们不同,则为1;如果它们相同,则为0,所有这些变量的方差都是有限的;因此,该数的分布近似为高斯分布,并且随着n的增加变得更为高斯

精确分布是二项式的,因为它是具有恒定概率的独立0/1变量的总和。指标变量都具有相同的概率,即指标=1的概率为1/2,指标=0的概率为1/2


我凭记忆工作;如果不亲自验证,就不要接受这个答案。

设X和Y是独立的随机变量,其值是从长度为n:X,Y~U{0,1}n的二进制字符串集中统一提取的

设dX,Y为汉明距离

那么dX,Y是一个随机变量,从a中抽取n个可能的事件,每个事件的概率p=0.5:dX,Y~Bn,0.5

其期望值为0.5×n


其标准偏差为0.5倍√n、

如果以1/2的概率独立绘制位,则位置k的一致性取决于第一个字符串第k个位置的结果-无论是0还是1,第二个字符串的匹配概率为1/2。这使得逐位分布p=1/2。汉明距离是这些伯努利结果的和,n个独立的伯努利结果的和有一个分布——这是一个精确的结果。你的实验应该得出n/2的平均值和np1-p或n/4的方差。这告诉我们,二项式分布将收敛到正态分布,即n->无穷大。工程学的一条经验法则是,当np>10和n1-p>10时,近似值就足够了。

您好,这个问题适合math.stackexchange.com。这个问题似乎离题了,因为它纯粹是关于统计的,与编程无关