Python 聚合数据帧中的行

Python 聚合数据帧中的行,python,python-3.x,pandas,machine-learning,pandas-groupby,Python,Python 3.x,Pandas,Machine Learning,Pandas Groupby,我有一个包含以下列的DataFrame: VisitorID(对每个用户都是唯一的-基于cookie) 访问次数(1=首次访问,2=第二次访问等) TimeSpentOnVist(访问持续时间以秒为单位) 频道(访问的推荐人。例如:Facebook、谷歌和必应) 媒体类型(付费或有机) 每次访问(1、2、3)都会重复访客ID。考虑到渠道和媒体类型的最后一次访问,我想对其进行汇总,但同时,汇总(总结)所有访问所花费的时间。我的目标是按来访者分组,这样就不会有重复 在熊猫中执行此聚合的最有效方法是什

我有一个包含以下列的DataFrame:

  • VisitorID(对每个用户都是唯一的-基于cookie)
  • 访问次数(1=首次访问,2=第二次访问等)
  • TimeSpentOnVist(访问持续时间以秒为单位)
  • 频道(访问的推荐人。例如:Facebook、谷歌和必应)
  • 媒体类型(付费或有机)
  • 每次访问(1、2、3)都会重复访客ID。考虑到渠道和媒体类型的最后一次访问,我想对其进行汇总,但同时,汇总(总结)所有访问所花费的时间。我的目标是按来访者分组,这样就不会有重复

    在熊猫中执行此聚合的最有效方法是什么?

    IIUC

    df.sort_values(['VisitNumber']).groupby('VisitorID').\
         agg({'TimeSpentOnVist':'sum','Channel':'last','Media type':'last'})
    

    温家宝回答了聚合问题,但我还创建了一个
    多索引来组织数据帧:

     df.set_index(['VisitorID','VisitNumber']).sort_index()