Pandas 具有混合唯一和聚合计算的Groupby
我有一个独特的数据框架,我正在尝试使用不同的方法进行分组和聚合。数据帧具有这些特征(本文中的示例数据)。下面也是截图。Pandas 具有混合唯一和聚合计算的Groupby,pandas,Pandas,我有一个独特的数据框架,我正在尝试使用不同的方法进行分组和聚合。数据帧具有这些特征(本文中的示例数据)。下面也是截图。 这是一个合并的数据集,由be\u id列表示。如果此表中存在记录,则它们在sha256_cpn及其第一个unique_call_rank上联接,这意味着此记录根据相关的be_id的数量进行复制 我正试图通过第一次呼叫和设备平台 sha256\u cpn是一个非唯一id,我想为调用和调用15秒聚合它,只要唯一调用排序不是上述解释中出现的重复值。基本统计unique\u cal
- 这是一个合并的数据集,由
列表示。如果此表中存在记录,则它们在be\u id
及其第一个sha256_cpn
上联接,这意味着此记录根据相关的be_id的数量进行复制unique_call_rank
- 我正试图通过
和第一次呼叫
设备平台
是一个非唯一id,我想为sha256\u cpn
和调用
聚合它,只要调用15秒
不是上述解释中出现的重复值。基本统计唯一调用排序
unique\u call\u秩的第一个实例和所有子序列秩(2,3,4,5等)
- 剩余的布尔列
,visit\u scheduled
将被聚合visit\u…
调用
和调用_15_秒
是唯一的,因为计数基于唯一调用_排名
1-#,但如果为1,则仅包括一次记录
目前,我已经尝试了以下代码,但它遗漏了unique\u call\u rank
标准,我不确定如何解释这一点
agg_df_sum = df.groupby([
'first_call',
'device_platform'
], as_index=False)['calls','calls_15_seconds', 'visit_scheduled', 'visit_cancelled', 'visit_completed', 'visit_rescheduled'].sum()