Statistics 从集合中选择元素的概率

Statistics 从集合中选择元素的概率,statistics,probability,normal-distribution,gamma-distribution,Statistics,Probability,Normal Distribution,Gamma Distribution,从一组n个元素中随机选择一个元素的预期概率为p=1.0/n。 假设我使用无偏方法检查P足够多次。P的分布类型是什么?很明显,P不是正态分布,因为P不能为负。因此,我可以正确地假设P是?如果是,这个分布的参数是什么? 显示了从100个元素集中选择元素1000次的概率直方图 有没有办法将其转换为标准发行版 现在假设选择给定元素的观测概率为p*(p*!=p)。我如何估计偏差是否具有统计学意义 编辑:这不是家庭作业。我正在做一个爱好项目,我需要这张统计数据。10年前我做了最后一个作业:-)你的分布是a吗

从一组n个元素中随机选择一个元素的预期概率为p=1.0/n。 假设我使用无偏方法检查P足够多次。P的分布类型是什么?很明显,P不是正态分布,因为P不能为负。因此,我可以正确地假设P是?如果是,这个分布的参数是什么? 显示了从100个元素集中选择元素1000次的概率直方图

有没有办法将其转换为标准发行版

现在假设选择给定元素的观测概率为p*(p*!=p)。我如何估计偏差是否具有统计学意义


编辑:这不是家庭作业。我正在做一个爱好项目,我需要这张统计数据。10年前我做了最后一个作业:-)你的分布是a吗?

这是一个明确的分布,p=1/(元素数)和n=(试验数)

要测试观察到的结果是否与预期结果存在显著差异,可以执行以下操作


这两个维基百科页面上的骰子例子应该会给你一些很好的指导,告诉你如何解决问题。在您的100元素1000试用示例中,这就像滚动100面模具1000次。

重复,您的分布将是二项式的。因此,X是选择某个固定对象的次数,总共选择了M个

p{X=X}=(M选择X)*(1/N)^X*(N-1/N)^(M-X)


对于大N,你可能会发现这很难计算。事实证明,对于足够大的N,这实际上收敛到概率为1的正态分布(中心极限定理)


在这种情况下,p{X=X}将由正态分布给出。平均值为M/N,方差为M*(1/N)*(N-1)/N.

正如其他人所指出的,您需要二项分布。不过,你的问题似乎暗示了你对它的持续近似感兴趣。它实际上可以是正态分布,也可以是。

这不是家庭作业。我正在做一个爱好项目,我需要这张统计数据。10年前,我做了最后一个家庭作业:-)这一切不都取决于你的随机数发生器吗?如果一个随机数生成器是完美的,那么无论选取的次数多少,每个选取的概率始终为1/n,在1000次选取之后,每个元素都应该被选取1000/n次——我似乎错过了一些东西。“这实际上收敛到概率为1的正态分布”:不,收敛是在分布中(在适当的重新缩放后)。两者之间的差异在这里并不相关,但从数学上讲,你的陈述是非常错误的。对于接近0或1的p,收敛速度也要慢得多,因此N必须非常大。