Python Pandas groupby（），agg（）-如何在没有多索引的情况下返回结果？_Python_Pandas_Group By_Aggregate_Multi Index

Python Pandas groupby（），agg（）-如何在没有多索引的情况下返回结果？

python pandas

Python Pandas groupby（），agg（）-如何在没有多索引的情况下返回结果？,python,pandas,group-by,aggregate,multi-index,Python,Pandas,Group By,Aggregate,Multi Index,我有一个数据帧： pe_odds[ [ 'EVENT_ID', 'SELECTION_ID', 'ODDS' ] ] Out[67]: EVENT_ID SELECTION_ID ODDS 0 100429300 5297529 18.00 1 100429300 5297529 20.00 2 100429300 5297529 21.00 3 100429300 5297529 22.00 4 10

我有一个数据帧：

pe_odds[ [ 'EVENT_ID', 'SELECTION_ID', 'ODDS' ] ]
Out[67]: 
     EVENT_ID  SELECTION_ID   ODDS
0   100429300       5297529  18.00
1   100429300       5297529  20.00
2   100429300       5297529  21.00
3   100429300       5297529  22.00
4   100429300       5297529  23.00
5   100429300       5297529  24.00
6   100429300       5297529  25.00

当我使用groupby和agg时，我会得到多索引的结果：

pe_odds.groupby( [ 'EVENT_ID', 'SELECTION_ID' ] )[ 'ODDS' ].agg( [ np.min, np.max ] )
Out[68]: 
                         amin   amax
EVENT_ID  SELECTION_ID              
100428417 5490293        1.71   1.71
          5881623        1.14   1.35
          5922296        2.00   2.00
          5956692        2.00   2.02
100428419 603721         2.44   2.90
          4387436        4.30   6.20
          4398859        1.23   1.35
          4574687        1.35   1.46
          4881396       14.50  19.00
          6032606        2.94   4.20
          6065580        2.70   5.80
          6065582        2.42   3.65
100428421 5911426        2.22   2.52

我尝试使用as_索引返回结果，但没有使用multi_索引：

pe_odds.groupby( [ 'EVENT_ID', 'SELECTION_ID' ], as_index=False )[ 'ODDS' ].agg( [ np.min, np.max ], as_index=False )

但它仍然给了我一个多重索引

我可以使用.reset_index（），但速度非常慢：

pe_odds.groupby( [ 'EVENT_ID', 'SELECTION_ID' ] )[ 'ODDS' ].agg( [ np.min, np.max ] ).reset_index()

pe_odds.groupby( [ 'EVENT_ID', 'SELECTION_ID' ] )[ 'ODDS' ].agg( [ np.min, np.max ] ).reset_index()
Out[69]: 
     EVENT_ID  SELECTION_ID   amin   amax
0   100428417       5490293   1.71   1.71
1   100428417       5881623   1.14   1.35
2   100428417       5922296   2.00   2.00
3   100428417       5956692   2.00   2.02
4   100428419        603721   2.44   2.90
5   100428419       4387436   4.30   6.20

在没有多索引的情况下，如何使用groupby和/或agg函数的参数返回结果。无需使用reset_index（）？

以下调用：

>>> gr = df.groupby(['EVENT_ID', 'SELECTION_ID'], as_index=False)
>>> res = gr.agg({'ODDS':[np.min, np.max]})
>>> res
    EVENT_ID SELECTION_ID ODDS     
                          amin amax
0  100429300      5297529   18   25
1  100429300      5297559   30   38

返回包含多个索引列的帧。如果不希望列为多索引，可以执行以下操作：

>>> res.columns = list(map(''.join, res.columns.values))
>>> res
    EVENT_ID  SELECTION_ID  ODDSamin  ODDSamax
0  100429300       5297529        18        25
1  100429300       5297559        30        38

在pandas v0.24.0中，

.to_flat_index（）

函数被引入到列中。这会将命令稍微更改为：

res.columns=[“\u.join（col\u name）.rstrip（“\u”）表示res.columns中的col\u name.to\u flat\u index（）]

。（请注意，我是如何在“u”上而不是在空格上连接的，以下划线而不是空格来连接第一级和第二级列名的。这让我感觉更像是一种python，但纯粹是我个人的偏好。）