Python 按标签放置列的范围_Python_Pandas

Python 按标签放置列的范围

python pandas

Python 按标签放置列的范围,python,pandas,Python,Pandas,假设我有一个大数据框： In [31]: df Out[31]: A B C D E F G H I J ... Q R S T U V W X Y Z 0 0 1 2 3 4 5 6 7 8 9 ... 16 17 18 19 20 21 22 23 24 25 1 26 27 28 29 30 31 32 33 34 35 ..

假设我有一个大数据框：

In [31]: df
Out[31]: 
    A   B   C   D   E   F   G   H   I   J ...   Q   R   S   T   U   V   W   X   Y   Z
0   0   1   2   3   4   5   6   7   8   9 ...  16  17  18  19  20  21  22  23  24  25
1  26  27  28  29  30  31  32  33  34  35 ...  42  43  44  45  46  47  48  49  50  51
2  52  53  54  55  56  57  58  59  60  61 ...  68  69  70  71  72  73  74  75  76  77

[3 rows x 26 columns]

您可以使用

alphabet = [chr(letter_i) for letter_i in range(ord('A'), ord('Z')+1)]
df = pd.DataFrame(np.arange(3*26).reshape(3, 26), columns=alphabet)

使用列标签在列
'D'
和
'R'
之间删除所有列的最佳方法是什么？

我发现了一个丑陋的方法：

df.drop(df.columns[df.columns.get_loc('D'):df.columns.get_loc('R')+1], axis=1)

给你：

print df.ix[:,'A':'C'].join(df.ix[:,'S':'Z'])

Out[1]: 
    A   B   C   S   T   U   V   W   X   Y   Z
0   0   1   2  18  19  20  21  22  23  24  25
1  26  27  28  44  45  46  47  48  49  50  51
2  52  53  54  70  71  72  73  74  75  76  77

使用numpy可获得更大的灵活性。。。numpy允许对字母进行比较（可能是通过在ASCII位级别进行比较或其他方式）：

给出：

['A' 'B' 'C' 'D']
array([False, False,  True,  True], dtype=bool)

array(['C'], 
  dtype='|S1')

更困难的选择也很容易实现：

b[np.logical_and(b>'B', b<'D')]

这是我的条目：

>>> df.drop(df.columns.to_series()["D":"R"], axis=1)
    A   B   C   S   T   U   V   W   X   Y   Z
0   0   1   2  18  19  20  21  22  23  24  25
1  26  27  28  44  45  46  47  48  49  50  51
2  52  53  54  70  71  72  73  74  75  76  77

通过将

df.列

从

索引

转换为

系列

，我们可以利用

[“D”：“R”]

-样式选择：

>>> df.columns.to_series()["D":"R"]
D        D
E        E
F        F
G        G
H        H
I        I
J        J
...    ...
Q        Q
R        R
dtype: object

还有另一种方法

low, high = df.columns.get_slice_bound(('D', 'R'), 'left')
drops = df.columns[low:high+1]
print df.drop(drops, axis=1)


    A   B   C   S   T   U   V   W   X   Y   Z
0   0   1   2  18  19  20  21  22  23  24  25
1  26  27  28  44  45  46  47  48  49  50  51
2  52  53  54  70  71  72  73  74  75  76  77

编辑为剪切而不是提取。这应该能奏效！

low, high = df.columns.get_slice_bound(('D', 'R'), 'left')
drops = df.columns[low:high+1]
print df.drop(drops, axis=1)


    A   B   C   S   T   U   V   W   X   Y   Z
0   0   1   2  18  19  20  21  22  23  24  25
1  26  27  28  44  45  46  47  48  49  50  51
2  52  53  54  70  71  72  73  74  75  76  77