Python 按类别获取最大值的索引
我有一个操作数据的数据框架。我需要返回每个Python 按类别获取最大值的索引,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个操作数据的数据框架。我需要返回每个供应商的记录及其相应的最大插入日期 #import pandas as pd #df = pd.read_clipboard() Vendor Insert_Date Total Steph 2017-10-25 2 Matt 2017-10-31 13 Chris 2017-11-03 3 Steve 2017-10-23 11 Chris 2017-10-27 3 Steve 2017-11-01 11
供应商
的记录及其相应的最大插入日期
#import pandas as pd
#df = pd.read_clipboard()
Vendor Insert_Date Total
Steph 2017-10-25 2
Matt 2017-10-31 13
Chris 2017-11-03 3
Steve 2017-10-23 11
Chris 2017-10-27 3
Steve 2017-11-01 11
我想返回以下结果(顺序不重要,除非它影响索引):
我可以通过使用
df.groupby(['Vendor']).agg({'Insert_Date':'max'})
检索每个供应商的最大插入日期
,但我希望有索引,这样我就可以使用iloc
(或其他形式的loc
)并过滤结果。我已经玩了一点,但似乎无法使用drop\u duplicates
df.sort_values(['Vendor','InsertDate']).drop_duplicates(['Vendor'],keep='last')
Out[1442]:
Vendor InsertDate Total
2 Chris 2017-11-03 3
1 Matt 2017-10-31 13
0 Steph 2017-10-25 2
5 Steve 2017-11-01 11
使用删除重复项
df.sort_values(['Vendor','InsertDate']).drop_duplicates(['Vendor'],keep='last')
Out[1442]:
Vendor InsertDate Total
2 Chris 2017-11-03 3
1 Matt 2017-10-31 13
0 Steph 2017-10-25 2
5 Steve 2017-11-01 11
IIUC:
输出:
Vendor Insert Date Total
2 Chris 2017-11-03 3
1 Matt 2017-10-31 13
0 Steph 2017-10-25 2
5 Steve 2017-11-01 11
IIUC:
输出:
Vendor Insert Date Total
2 Chris 2017-11-03 3
1 Matt 2017-10-31 13
0 Steph 2017-10-25 2
5 Steve 2017-11-01 11
向我们展示您迄今为止一直在尝试的代码。@GiantSlovedAthmetal,我的真实数据集中有很多列,这种“硬编码”不适用。也许我应该在我的问题中更清楚地说明这一点对不起,我没有一个好的建议。向我们展示你迄今为止一直在尝试的代码。@GiantSlovedAthmetal,我的真实数据集中有很多列,这种“硬编码”不适用。也许我应该在我的问题中说得更清楚对不起,我没有一个好的建议。当我尝试使用它时,idxmax会抛出错误。您是否先将其转换为日期时间列?@cᴏʟᴅsᴘᴇᴇᴅ 啊。。是的,我做了。啊,这就是如何应用idxmax
。当我尝试使用它时,DXMAX会向我抛出错误。您是否先将其转换为日期时间列?@cᴏʟᴅsᴘᴇᴇᴅ 啊。。是的,我做了。啊,这就是如何应用idxmax
。我找不到正确的应用程序控制杆。我尝试过使用排序值,但从未想过要删除重复项。我尝试使用排序值,但从未想过要删除重复项