Math 密度为0.5的分布

Math 密度为0.5的分布,math,scipy,statistics,distribution,Math,Scipy,Statistics,Distribution,我有一个包含两种不同分布的直方图。我想将gumbel_r分布拟合到其中一个,但问题是pdf函数期望曲线下的密度或面积为1。如何将分布更改为0.5 gumbel_data = gumbel_r.rvs(size=10000, loc=0) gaussian_data = norm.rvs(size=10000, loc=10) plt.hist(list(gumbel_data) + list(gaussian_data), bins=40, density=True) plt.plot(np.

我有一个包含两种不同分布的直方图。我想将gumbel_r分布拟合到其中一个,但问题是pdf函数期望曲线下的密度或面积为1。如何将分布更改为0.5

gumbel_data = gumbel_r.rvs(size=10000, loc=0)
gaussian_data = norm.rvs(size=10000, loc=10)

plt.hist(list(gumbel_data) + list(gaussian_data), bins=40, density=True)
plt.plot(np.sort(list(gumbel_data) + list(gaussian_data)), gumbel_r.pdf(np.sort(list(gumbel_data) + list(gaussian_data))))
plt.show()

你可以说结果来自一个或另一个分布,每个分布的概率为0.5,但根据定义,任何概率上下文中的总面积必须为1。如果你仔细想想,这就是你在这里看到的——20000个观察中有10000个来自gumbel_r,10000个来自正常。我投票结束这个问题,因为这个问题似乎是基于概念上的误解,而不是实际问题。我不同意,分布是双峰的,我想将每一个分布拟合到它们各自的pdf,如果我使用gumbel_r pdf和gaussian pdf这样做,我将得到概率=2。因此,如果我用概率0.5来模拟每个分布,我将得到1,这就是所谓的混合密度问题。期望最大化算法是一种传统的方法。后续内容应访问stats.stackexchange.com,因为这更像是一个概念性问题。你错了。合并两个列表后,样本空间为20k个观测值。Robert Dodier认为结果是混合物密度是正确的。