Python numpy排序上下
我试图将顶部的5%、底部的5%和剩余的5%提取到单独的数组中,并保存平均值。我的代码如下Python numpy排序上下,python,sorting,numpy,scipy,Python,Sorting,Numpy,Scipy,我试图将顶部的5%、底部的5%和剩余的5%提取到单独的数组中,并保存平均值。我的代码如下 tg = 48000000 element float array tg.sort() pct = int(tg.size*0.05) high5 = tg[-pct:].mean() low5 = tg[:pct].mean() mid90 = tg[pct:-pct].mean() 如果您能就如何加快速度提出建议,我将不胜感激。实际上,您不需要对阵列进行
tg = 48000000 element float array
tg.sort()
pct = int(tg.size*0.05)
high5 = tg[-pct:].mean()
low5 = tg[:pct].mean()
mid90 = tg[pct:-pct].mean()
如果您能就如何加快速度提出建议,我将不胜感激。实际上,您不需要对阵列进行完全排序。您可以使用分区方法:
tg = 48000000 element float array
pct = int(tg.size*0.05)
tg.partition([pct, tg.size - pct])
mean_low5 = tg[:pct].mean()
mean_high5 = tg[-pct:].mean()
mean_mid90 = tg[pct:-pct].mean()
(代码根据Jaime的评论进行了更新)绝大多数时间都花在
排序
调用中。这是一个相当优化的算法,因此基本答案是您可能无法加快速度。您可能可以这样做。这是一个好主意(+1)np。分区
可以占据一系列位置,即您可以执行tg.partition([pct,tg.size pct])
,而不必担心对分区的secon调用会扰乱前一个分区的结果。当然,您也可以在第二次调用中执行tg[pct:].partition(tg.size-2*pct)
,以避免第一次调用结果的混乱。