Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/arrays/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Arrays 以numpy/scipy计算矢量化百分位数的快速方法?_Arrays_Numpy_Scipy_Statistics - Fatal编程技术网

Arrays 以numpy/scipy计算矢量化百分位数的快速方法?

Arrays 以numpy/scipy计算矢量化百分位数的快速方法?,arrays,numpy,scipy,statistics,Arrays,Numpy,Scipy,Statistics,给定一个值数组: v = np.random.randn(100) 计算数组中每个元素百分比的最快方法是什么?以下是缓慢的: %timeit map(lambda e: scipy.stats.percentileofscore(v, e), v) 100 loops, best of 3: 5.1 ms per loop 您可以使用来实现相同的结果: In [58]: v = np.random.randn(10) In [59]: print(list(map(lambda e: sc

给定一个值数组:

v = np.random.randn(100)
计算数组中每个元素百分比的最快方法是什么?以下是缓慢的:

%timeit map(lambda e: scipy.stats.percentileofscore(v, e), v)
100 loops, best of 3: 5.1 ms per loop
您可以使用来实现相同的结果:

In [58]: v = np.random.randn(10)

In [59]: print(list(map(lambda e: scipy.stats.percentileofscore(v, e), v)))
[30.0, 40.0, 50.0, 90.0, 20.0, 60.0, 10.0, 70.0, 80.0, 100.0]

In [60]: from scipy.stats import rankdata

In [61]: rankdata(v)*100/len(v)
Out[61]: array([  30.,   40.,   50.,   90.,   20.,   60.,   10.,   70.,   80.,  100.])

根据您对百分位数的定义,您可能需要rankdatav-1/lenv-1,它将百分位数的最低值指定为0@Eric我对排名进行了调整,以匹配问题中代码给出的结果,但您的建议也是合理的惯例。即使只是rankdatav可能就足够了,这取决于将对结果做什么。