Python 如何在dataframe中创建倾斜列?
我想在数据框中创建一个新列,该列的分布是倾斜的。我希望它有64000个数据点,最小值为0(没有负值),以及某种扭曲的形状,其中大多数人都接近0,然后它在右边以更高的值水平 我已经试过了,但是做不到。非常感谢您的帮助Python 如何在dataframe中创建倾斜列?,python,pandas,numpy,statistics,distribution,Python,Pandas,Numpy,Statistics,Distribution,我想在数据框中创建一个新列,该列的分布是倾斜的。我希望它有64000个数据点,最小值为0(没有负值),以及某种扭曲的形状,其中大多数人都接近0,然后它在右边以更高的值水平 我已经试过了,但是做不到。非常感谢您的帮助 rv = skewnorm.rvs(400000, size=100000) 您可以使用或分发,具体取决于您的目标指数分布将给出连续值,而泊松分布将给出离散值。两者都可以在numpy包中找到。创建numpy数组后,可以轻松地将其添加到pandas数据帧中 指数分布(): impor
rv = skewnorm.rvs(400000, size=100000)
您可以使用或分发,具体取决于您的目标指数分布将给出连续值,而泊松分布将给出离散值。两者都可以在numpy
包中找到。创建numpy
数组后,可以轻松地将其添加到pandas
数据帧中
指数分布():
import numpy as np
beta = 10
s = np.random.exponential(beta, 64000)
import numpy as np
lam = 0.9
s = np.random.poisson(lam , 64000)
beta
作为比例参数,将确定值的大小,同时保持一般分布形状。带有beta=10
和100个箱子的绘图:
泊松分布():
import numpy as np
beta = 10
s = np.random.exponential(beta, 64000)
import numpy as np
lam = 0.9
s = np.random.poisson(lam , 64000)
速率参数lam
将确定分布的形状。平均值和方差都将等于lam
。请注意,仅获得离散值。使用lam=0.9
和8个箱子进行绘图:
如果有一个固定的上限,模式接近(或处于)零将是另一种选择。