Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/281.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 数据帧中不同变量的最近时间_Python_Python 3.x_Pandas - Fatal编程技术网

Python 数据帧中不同变量的最近时间

Python 数据帧中不同变量的最近时间,python,python-3.x,pandas,Python,Python 3.x,Pandas,我有一个问题,我需要找出不同角色的最近日期。 例如: Traveler Date A 11/20/2017 B 11/20/2017 A 11/28/2018 B 11/28/2018 A 12/30/2018 我希望结果如下: Traveler Date A 12/30/2018 B 11/28/2018 我试过max和min,但他们都没有给我想要的答案。

我有一个问题,我需要找出不同角色的最近日期。 例如:

Traveler   Date
A          11/20/2017
B          11/20/2017
A          11/28/2018
B          11/28/2018 
A          12/30/2018
我希望结果如下:

Traveler   Date
A          12/30/2018
B          11/28/2018

我试过max和min,但他们都没有给我想要的答案。非常感谢你的帮助

您可以使用将日期转换为日期时间,然后使用和最大值:

我要做的是删除重复项


如果旅行者不能在同一日期出现两次,您可以简单地执行df.sort_值[date,traveler],升序=False。此方法确实有效,但当我尝试为date列指定标题时,它会添加一个新列,新标题仅在该列中显示NaT。我如何解决此问题?您能否显示您的问题,并使用此列聚合显示您的预期数据框?预期数据框是问题中发布的数据框,其中应包含第二列的标题日期。很抱歉,您只需重置索引即可设置类似“Traveler”的列。请告诉我它是否有效
df['Date']=pd.to_datetime(df['Date'])
df_last=df.groupby('Traveler')['Date'].max().reset_index()
print(df_last)


  Traveler       Date
0        A 2018-12-30
1        B 2018-11-28
df.sort_values('Date').drop_duplicates('Traveler',keep='last')
Out[94]: 
  Traveler       Date
3        B 2018-11-28
4        A 2018-12-30