Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/362.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何在dataframe中创建倾斜列?_Python_Pandas_Numpy_Statistics_Distribution - Fatal编程技术网

Python 如何在dataframe中创建倾斜列?

Python 如何在dataframe中创建倾斜列?,python,pandas,numpy,statistics,distribution,Python,Pandas,Numpy,Statistics,Distribution,我想在数据框中创建一个新列,该列的分布是倾斜的。我希望它有64000个数据点,最小值为0(没有负值),以及某种扭曲的形状,其中大多数人都接近0,然后它在右边以更高的值水平 我已经试过了,但是做不到。非常感谢您的帮助 rv = skewnorm.rvs(400000, size=100000) 您可以使用或分发,具体取决于您的目标指数分布将给出连续值,而泊松分布将给出离散值。两者都可以在numpy包中找到。创建numpy数组后,可以轻松地将其添加到pandas数据帧中 指数分布(): impor

我想在数据框中创建一个新列,该列的分布是倾斜的。我希望它有64000个数据点,最小值为0(没有负值),以及某种扭曲的形状,其中大多数人都接近0,然后它在右边以更高的值水平

我已经试过了,但是做不到。非常感谢您的帮助

rv = skewnorm.rvs(400000, size=100000)
您可以使用或分发,具体取决于您的目标指数分布将给出连续值,而泊松分布将给出离散值。两者都可以在
numpy
包中找到。创建
numpy
数组后,可以轻松地将其添加到
pandas
数据帧中

指数分布():

import numpy as np

beta = 10
s = np.random.exponential(beta, 64000)
import numpy as np

lam = 0.9
s = np.random.poisson(lam , 64000)
beta
作为比例参数,将确定值的大小,同时保持一般分布形状。带有
beta=10
和100个箱子的绘图:

泊松分布():

import numpy as np

beta = 10
s = np.random.exponential(beta, 64000)
import numpy as np

lam = 0.9
s = np.random.poisson(lam , 64000)
速率参数
lam
将确定分布的形状。平均值和方差都将等于
lam
。请注意,仅获得离散值。使用
lam=0.9
和8个箱子进行绘图:

如果有一个固定的上限,模式接近(或处于)零将是另一种选择。