Python 数据帧中不同变量的最近时间
我有一个问题,我需要找出不同角色的最近日期。 例如:Python 数据帧中不同变量的最近时间,python,python-3.x,pandas,Python,Python 3.x,Pandas,我有一个问题,我需要找出不同角色的最近日期。 例如: Traveler Date A 11/20/2017 B 11/20/2017 A 11/28/2018 B 11/28/2018 A 12/30/2018 我希望结果如下: Traveler Date A 12/30/2018 B 11/28/2018 我试过max和min,但他们都没有给我想要的答案。
Traveler Date
A 11/20/2017
B 11/20/2017
A 11/28/2018
B 11/28/2018
A 12/30/2018
我希望结果如下:
Traveler Date
A 12/30/2018
B 11/28/2018
我试过max和min,但他们都没有给我想要的答案。非常感谢你的帮助 您可以使用将日期转换为日期时间,然后使用和最大值: 我要做的是删除重复项
如果旅行者不能在同一日期出现两次,您可以简单地执行df.sort_值[date,traveler],升序=False。此方法确实有效,但当我尝试为date列指定标题时,它会添加一个新列,新标题仅在该列中显示NaT。我如何解决此问题?您能否显示您的问题,并使用此列聚合显示您的预期数据框?预期数据框是问题中发布的数据框,其中应包含第二列的标题日期。很抱歉,您只需重置索引即可设置类似“Traveler”的列。请告诉我它是否有效
df['Date']=pd.to_datetime(df['Date'])
df_last=df.groupby('Traveler')['Date'].max().reset_index()
print(df_last)
Traveler Date
0 A 2018-12-30
1 B 2018-11-28
df.sort_values('Date').drop_duplicates('Traveler',keep='last')
Out[94]:
Traveler Date
3 B 2018-11-28
4 A 2018-12-30