Python 按标签放置列的范围
假设我有一个大数据框:Python 按标签放置列的范围,python,pandas,Python,Pandas,假设我有一个大数据框: In [31]: df Out[31]: A B C D E F G H I J ... Q R S T U V W X Y Z 0 0 1 2 3 4 5 6 7 8 9 ... 16 17 18 19 20 21 22 23 24 25 1 26 27 28 29 30 31 32 33 34 35 ..
In [31]: df
Out[31]:
A B C D E F G H I J ... Q R S T U V W X Y Z
0 0 1 2 3 4 5 6 7 8 9 ... 16 17 18 19 20 21 22 23 24 25
1 26 27 28 29 30 31 32 33 34 35 ... 42 43 44 45 46 47 48 49 50 51
2 52 53 54 55 56 57 58 59 60 61 ... 68 69 70 71 72 73 74 75 76 77
[3 rows x 26 columns]
您可以使用
alphabet = [chr(letter_i) for letter_i in range(ord('A'), ord('Z')+1)]
df = pd.DataFrame(np.arange(3*26).reshape(3, 26), columns=alphabet)
使用列标签在列
'D'
和'R'
之间删除所有列的最佳方法是什么?
我发现了一个丑陋的方法:
df.drop(df.columns[df.columns.get_loc('D'):df.columns.get_loc('R')+1], axis=1)
给你:
print df.ix[:,'A':'C'].join(df.ix[:,'S':'Z'])
Out[1]:
A B C S T U V W X Y Z
0 0 1 2 18 19 20 21 22 23 24 25
1 26 27 28 44 45 46 47 48 49 50 51
2 52 53 54 70 71 72 73 74 75 76 77
使用numpy可获得更大的灵活性。。。numpy允许对字母进行比较(可能是通过在ASCII位级别进行比较或其他方式): 给出:
['A' 'B' 'C' 'D']
array([False, False, True, True], dtype=bool)
array(['C'],
dtype='|S1')
更困难的选择也很容易实现:
b[np.logical_and(b>'B', b<'D')]
这是我的条目:
>>> df.drop(df.columns.to_series()["D":"R"], axis=1)
A B C S T U V W X Y Z
0 0 1 2 18 19 20 21 22 23 24 25
1 26 27 28 44 45 46 47 48 49 50 51
2 52 53 54 70 71 72 73 74 75 76 77
通过将df.列
从索引
转换为系列
,我们可以利用[“D”:“R”]
-样式选择:
>>> df.columns.to_series()["D":"R"]
D D
E E
F F
G G
H H
I I
J J
... ...
Q Q
R R
dtype: object
还有另一种方法
low, high = df.columns.get_slice_bound(('D', 'R'), 'left')
drops = df.columns[low:high+1]
print df.drop(drops, axis=1)
A B C S T U V W X Y Z
0 0 1 2 18 19 20 21 22 23 24 25
1 26 27 28 44 45 46 47 48 49 50 51
2 52 53 54 70 71 72 73 74 75 76 77
编辑为剪切而不是提取。这应该能奏效!
low, high = df.columns.get_slice_bound(('D', 'R'), 'left')
drops = df.columns[low:high+1]
print df.drop(drops, axis=1)
A B C S T U V W X Y Z
0 0 1 2 18 19 20 21 22 23 24 25
1 26 27 28 44 45 46 47 48 49 50 51
2 52 53 54 70 71 72 73 74 75 76 77