Python 熊猫-分组、分类并保持第一排

Python 熊猫-分组、分类并保持第一排,python,pandas,dataframe,group-by,pandas-groupby,Python,Pandas,Dataframe,Group By,Pandas Groupby,我有一个数据帧,需要按id分组,然后按时间排序,只保留每个id的第一条记录。尝试了其他答案中建议的不同方法,但未能得到正确的结果。我会感谢你的帮助 test = pd.DataFrame({'id' : [1,1,1, 2,2, 3,3,3,3], 'ref' : ["search","social","direct",

我有一个数据帧,需要按
id
分组,然后按
时间
排序,只保留每个
id
的第一条记录。尝试了其他答案中建议的不同方法,但未能得到正确的结果。我会感谢你的帮助

test = pd.DataFrame({'id' : [1,1,1,
                           2,2,
                           3,3,3,3],
                   'ref'  : ["search","social","direct",
                          "social","direct",
                          "direct",'social','social','social'],
                   'media':['video', 'page', 'video',
                           'page', 'pic', 
                            'pic', 'video', 'page', 'video'],
                   'time': ['2019-04-10 19:00:00.569', '2019-04-10 00:10:00.569', '2019-04-10 00:10:20.569',
                          '2019-04-10 12:10:00.569','2019-04-10 11:10:00.569',
                          '2019-04-10 22:10:00.569','2019-04-10 14:10:00.569','2019-04-10 14:30:00.569','2019-04-10 15:10:00.569']})
预期结果:

    id  ref     media
0   1   social  page
1   2   direct  pic
2   3   social  video

您可以排序然后删除重复项:

test.sort_values(by=['id', 'time']).drop_duplicates('id').drop('time',1)

   id     ref  media
1   1  social   page
4   2  direct    pic
6   3  social  video

谢谢我没有想到我会使用drop_dublicaytes!