Probability 平均而言,一个篮子频繁出现的预期概率是多少?

Probability 平均而言,一个篮子频繁出现的预期概率是多少?,probability,Probability,我正在阅读频繁模式挖掘算法,并提出了以下问题。假设一家公司有10000种不同的产品,每个交易有100000000笔,其中正好包含10种不同的产品。如果对每个篮子都统一选择一个产品,那么在100000000笔交易中,一个给定的10号固定篮子被选择1000次的概率是多少 这是自我学习,问题在第9张幻灯片中说明了。我不是概率论专家,但我认为机会实际上是零。想知道为什么,想象一下你有一个盒子,里面有所有可能的篮子。设B为方框的基数,因此从方框中提取一个特定篮子的概率为p=1/B,约为p=10^(-40)

我正在阅读频繁模式挖掘算法,并提出了以下问题。假设一家公司有10000种不同的产品,每个交易有100000000笔,其中正好包含10种不同的产品。如果对每个篮子都统一选择一个产品,那么在100000000笔交易中,一个给定的10号固定篮子被选择1000次的概率是多少


这是自我学习,问题在第9张幻灯片中说明了。我不是概率论专家,但我认为机会实际上是零。想知道为什么,想象一下你有一个盒子,里面有所有可能的篮子。设
B
为方框的基数,因此从方框中提取一个特定篮子的概率为
p=1/B
,约为
p=10^(-40)
。想象一下,你用替换的方法从这个框中画出
N
次。然后,您会期望这个特定的篮子将被绘制
m=N/B次
。这是实验的预期频率

该取样过程的标准偏差(
N
绘制成功概率
p
)为
σ=sqrt(N*p*(1-p))
。如果你用
N=10^9
p=10^(-40)
进行计算,你会发现
σ=sqrt(10^(-31))

现在假设实验的观测频率为
f=10^3
。由于预期频率为
m=N/B=10^9/10^40=10^(-31)
,因此本实验的
z得分为

z = (f-m)/σ = sqrt(10)*10^17
通过法向近似给出至少观察特定篮子的
f
实例的机会,即
z
和无穷大之间的标准法向曲线下的面积。这个区域实际上是零