Python 理解NumPy';使用高级索引时的复制行为

Python 理解NumPy';使用高级索引时的复制行为,python,arrays,numpy,Python,Arrays,Numpy,我目前正在努力使用高级索引在NumPy中编写整洁的代码 arr = np.arange(100).reshape(10,10) # array I want to manipulate sl1 = arr[:,-1] # basic indexing # Do stuff with sl1... sl1[:] = -1 # arr has been changed as well sl2 = arr[arr >= 50] # advanced indexing # Do stuff wit

我目前正在努力使用高级索引在NumPy中编写整洁的代码

arr = np.arange(100).reshape(10,10) # array I want to manipulate
sl1 = arr[:,-1] # basic indexing
# Do stuff with sl1...
sl1[:] = -1
# arr has been changed as well
sl2 = arr[arr >= 50] # advanced indexing
# Do stuff with sl2...
sl2[:] = -2
# arr has not been changed, 
# changes must be written back into it
arr[arr >= 50] = sl2 # What I'd like to avoid

我想避免这种“回写”操作,因为这感觉是多余的,而且我经常忘记它。有没有更优雅的方法来完成同样的事情?

布尔和整数数组索引都属于。在第二个示例(布尔索引)中,您将看到原始数组没有更新,这是因为
高级索引
始终返回数据的副本(请参见本教程高级索引部分的第二段)。这意味着,一旦您执行了
arr[arr>=50]
操作,这已经是
arr
的一个副本,并且您对其应用的任何更改都不会影响
arr

它不返回视图的原因是高级索引不能表示为切片,因此不能使用偏移量、跨距和计数进行处理,而偏移量、跨距和计数是查看阵列元素所必需的

我们可以很容易地验证,在高级索引的情况下,我们正在查看不同的对象,包括:

np.shares_memory(arr, arr[arr>50])
# False
np.shares_memory(arr, arr[:,-1])
# True
仅在执行基本切片操作时返回视图。因此,您必须像在上一个示例中那样重新分配。关于评论中的问题,当在同一表达式中重新赋值时:

arr[arr >= 50] = -2
python解释器将其翻译为:

arr.__setitem__(arr >= 50, -2)

这里需要理解的是,表达式可以就地计算,因此不需要创建新的对象。在这个简单的例子中,您可以直接为
arr
赋值,就像
arr[arr>=50]=-2
。在我的用例中,这不是一个选项。这就是我试图用
#Do stuff with sl2…
注释传达的内容。
sl2
没有任何关于它从何而来的“记录”。看看它。这是一个一维数组。最后一项作业没有多余的地方!
视图
与源视图的区别仅在于其
形状
步幅
;如果
arr[arr>=50]
已经是一个副本,为什么
arr[arr>=50]=-2
改变
arr
?是的,谢谢你的帮助。人蟒蛇在引擎盖下做了很多奇怪的事情。。。