Python 基于索引的切割numpy数组
我有一个1DPython 基于索引的切割numpy数组,python,arrays,numpy,optimization,Python,Arrays,Numpy,Optimization,我有一个1Dnumpy数组。此数组中两个后续值之间的差值为一或大于一。我想将数组分割成不同的部分,每次差异大于一。因此: arr = numpy.array([77, 78, 79, 80, 90, 91, 92, 100, 101, 102, 103, 104]) 应该成为 [array([77, 78, 79, 80]), array([90, 91, 92]), array([100, 101, 102, 103, 104])] 我有下面的代码来实现这个技巧,但我觉得我在这里变得复杂了
numpy
数组。此数组中两个后续值之间的差值为一或大于一。我想将数组分割成不同的部分,每次差异大于一。因此:
arr = numpy.array([77, 78, 79, 80, 90, 91, 92, 100, 101, 102, 103, 104])
应该成为
[array([77, 78, 79, 80]), array([90, 91, 92]), array([100, 101, 102, 103, 104])]
我有下面的代码来实现这个技巧,但我觉得我在这里变得复杂了。必须有一种更好的/更像蟒蛇的方式。谁有更优雅的方法
import numpy
def split(arr, cut_idxs):
empty_arr = []
for idx in range(-1, cut_idxs.shape[0]):
if idx == -1:
l, r = 0, cut_idxs[0]
elif (idx != -1) and (idx != cut_idxs.shape[0] - 1):
l, r = cut_idxs[idx] + 1, cut_idxs[idx + 1]
elif idx == cut_idxs.shape[0] - 1:
l, r = cut_idxs[-1] + 1, arr.shape[0]
empty_arr.append(arr[l:r + 1])
return empty_arr
arr = numpy.array([77, 78, 79, 80, 90, 91, 92, 100, 101, 102, 103, 104])
cuts = numpy.where(numpy.ediff1d(arr) > 2)[0]
print split(arr, cuts)
一种类似蟒蛇的方式是-
np.split(arr, np.flatnonzero(np.diff(arr)>1)+1)
样本运行-
In [10]: arr
Out[10]: array([ 77, 78, 79, 80, 90, 91, 92, 100, 101, 102, 103, 104])
In [11]: np.split(arr, np.flatnonzero(np.diff(arr)>1)+1)
Out[11]:
[array([77, 78, 79, 80]),
array([90, 91, 92]),
array([100, 101, 102, 103, 104])]
另一个带有切片的-
In [16]: cut_idx = np.r_[0,np.flatnonzero(np.diff(arr)>1)+1,len(arr)]
# Or np.flatnonzero(np.r_[True, np.diff(arr)>1, True])
In [17]: [arr[i:j] for i,j in zip(cut_idx[:-1],cut_idx[1:])]
Out[17]:
[array([77, 78, 79, 80]),
array([90, 91, 92]),
array([100, 101, 102, 103, 104])]
另一种切片方法是使用np.diff
获得适当的索引:
import numpy as np
def split(arr):
idx = np.pad(np.where(np.diff(arr) > 1)[0]+1, (1,1),
'constant', constant_values = (0, len(arr)))
return [arr[idx[i]: idx[i+1]] for i in range(len(idx)-1)]
结果:
arr = np.array([77, 78, 79, 80, 90, 91, 92, 100, 101, 102, 103, 104])
>>> split(arr)
[array([77, 78, 79, 80]), array([90, 91, 92]), array([100, 101, 102, 103, 104])]
在您的例子中,切片“map”idx
最终是:数组([0,4,7,12])
,即diff
大于1(索引4
和7
),左侧用零填充,右侧用0填充数组长度(12
)
但是,@Divakar建议的np.split
,似乎是一种方法使用np.flatnonzero而不是np.where?@TheDude-Nope,np.flatnonzero
更明确的是,我们使用的是一维数组。