Pandas 具有混合唯一和聚合计算的Groupby

Pandas 具有混合唯一和聚合计算的Groupby,pandas,Pandas,我有一个独特的数据框架,我正在尝试使用不同的方法进行分组和聚合。数据帧具有这些特征(本文中的示例数据)。下面也是截图。 这是一个合并的数据集,由be\u id列表示。如果此表中存在记录,则它们在sha256_cpn及其第一个unique_call_rank上联接,这意味着此记录根据相关的be_id的数量进行复制 我正试图通过第一次呼叫和设备平台 sha256\u cpn是一个非唯一id,我想为调用和调用15秒聚合它,只要唯一调用排序不是上述解释中出现的重复值。基本统计unique\u cal

我有一个独特的数据框架,我正在尝试使用不同的方法进行分组和聚合。数据帧具有这些特征(本文中的示例数据)。下面也是截图。

  • 这是一个合并的数据集,由
    be\u id
    列表示。如果此表中存在记录,则它们在
    sha256_cpn
    及其第一个
    unique_call_rank
    上联接,这意味着此记录根据相关的be_id的数量进行复制
  • 我正试图通过
    第一次呼叫
    设备平台
  • sha256\u cpn
    是一个非唯一id,我想为
    调用
    调用15秒
    聚合它,只要
    唯一调用排序
    不是上述解释中出现的重复值。基本统计
    unique\u call\u秩的第一个实例和所有子序列秩(2,3,4,5等)
  • 剩余的布尔列
    visit\u scheduled
    visit\u…
    将被聚合
此信息表明
调用
调用_15_秒
是唯一的,因为计数基于
唯一调用_排名
1-#,但如果为1,则仅包括一次记录

目前,我已经尝试了以下代码,但它遗漏了
unique\u call\u rank
标准,我不确定如何解释这一点

agg_df_sum = df.groupby([
    'first_call',
    'device_platform'
], as_index=False)['calls','calls_15_seconds', 'visit_scheduled', 'visit_cancelled', 'visit_completed', 'visit_rescheduled'].sum()