如何在python中选择矩阵中的非零列
假设我有以下格式的数据:如何在python中选择矩阵中的非零列,python,python-3.x,numpy,Python,Python 3.x,Numpy,假设我有以下格式的数据: C0 C1 C2 C3 C4 C5 C6 C7 C8 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 3 4 5 6 0 0 0 1 4 5 6 7 8 0 0 0 0 0 0 0 0 0 0 0 我想选择非零列,例如python中的列C1、C2、C3、C4、C5、C6。任何可以直接为我提供所需格式的命令。如果您使用像pandas这样的库,那么它会更简单
C0 C1 C2 C3 C4 C5 C6 C7 C8
0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0
0 0 2 3 4 5 6 0 0
0 1 4 5 6 7 8 0 0
0 0 0 0 0 0 0 0 0
我想选择非零列,例如python中的列
C1、C2、C3、C4、C5、C6
。任何可以直接为我提供所需格式的命令。如果您使用像pandas这样的库,那么它会更简单
您只需取每列的平均值,如果它们大于0,则它们是您所需的列
为此,我将给您一段代码:
import pandas as pd
df = pd.read_csv("File Path")
a = df.mean(axis=0) #gives you column wise mean
for i in len(a):
if a[i] > 0:
print(i) # i will be your column
假设矩阵实现为列表列表,其中第一个索引是列,第二个索引是行:
matrix[3][2] == 3
然后,您可以使用列表理解来获得一个列表,其中仅包含矩阵中不全为零的列
nonzero_columns = [column for column in matrix if any(column)]
# any() will return true here if any element of column is nonzero
您可以使用any
和numpy
索引来选择具有非零值的列
设置
使用numpy
:
import numpy as np
a = np.array([[0,0,0,0,0,0,0,0,0],
[0,0,0,0,0,0,0,0,0],
[0,0,2,3,4,5,6,0,0],
[0,1,4,5,6,7,8,0,0],
[0,1,4,5,6,7,8,0,0]])
r = np.nonzero(np.any(a != 0, axis=0))[0]
>>> r
[1 2 3 4 5 6]
如果您需要这些列名(C1
,C2
,C3
,C4
,C5
,C6
),请使用pandas
:
columns = ['C0', 'C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8']
s = pd.DataFrame(data=a, columns=columns).any()
s = s[s == 1]
>>> s
C1 True
C2 True
C3 True
C4 True
C5 True
C6 True
dtype: bool
这是什么样的数据结构?包含C1、C2、C3、C4、C5列的矩阵,C6@RayyanKhan什么样的矩阵?熊猫DF,NumPy数组,Python列表列表。。。等等@Tomothy32,我有一个n*n格式的NumPy数组,因为数组的大小更大,我不认为使用loop可以得到期望的结果,因为它需要大量的计算时间。该数组的大小不超过_columns@RayyanKhan.any()似乎是唯一的其他方法,但是这也使用了loopsYes,但是为了让你明白我使用了这种方法如果这有助于你,请将其作为验证答案谢谢你的友好回复。另外,如果我想以类似的方式排除行,比如如果我想要第2行和第3行,我应该使用什么命令?行应该是a[a.any(1)]
array([[0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0],
[0, 2, 3, 4, 5, 6],
[1, 4, 5, 6, 7, 8],
[0, 0, 0, 0, 0, 0]], dtype=int64)
import numpy as np
a = np.array([[0,0,0,0,0,0,0,0,0],
[0,0,0,0,0,0,0,0,0],
[0,0,2,3,4,5,6,0,0],
[0,1,4,5,6,7,8,0,0],
[0,1,4,5,6,7,8,0,0]])
r = np.nonzero(np.any(a != 0, axis=0))[0]
>>> r
[1 2 3 4 5 6]
columns = ['C0', 'C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8']
s = pd.DataFrame(data=a, columns=columns).any()
s = s[s == 1]
>>> s
C1 True
C2 True
C3 True
C4 True
C5 True
C6 True
dtype: bool