Python Pandas分组并对两列求和
初学者问题。这似乎应该是一个简单的操作,但我无法通过阅读文档来理解 我有一个具有这种结构的df:Python Pandas分组并对两列求和,python,pandas,Python,Pandas,初学者问题。这似乎应该是一个简单的操作,但我无法通过阅读文档来理解 我有一个具有这种结构的df: |integer_id|int_field_1|int_field_2| integer_id列是非唯一的,因此我想按integer_id对df进行分组,并对这两个字段求和 等效的SQL是: SELECT integer_id, SUM(int_field_1), SUM(int_field_2) FROM tbl GROUP BY integer_id 关于最简单的方法有什么建议吗 编辑:包括
|integer_id|int_field_1|int_field_2|
integer_id列是非唯一的,因此我想按integer_id对df进行分组,并对这两个字段求和
等效的SQL是:
SELECT integer_id, SUM(int_field_1), SUM(int_field_2) FROM tbl
GROUP BY integer_id
关于最简单的方法有什么建议吗
编辑:包括输入/输出
Input:
integer_id int_field_1 int_field_2
2656 36 36
2656 36 36
9702 2 2
9702 1 1
使用df.groupby('integer_id').sum()输出:
您只需在
groupby
对象上调用sum
:
df.groupby('integer_id').sum()
有关更多示例,请参见
data.groupby(by=['account_ID'])['purchases'].sum()
.agg()函数的变体;提供以下功能:(1)持久化类型数据帧;(2)应用平均值、计数、求和等;(3)在保持易读性的同时启用多列groupby
df.groupby(['att1', 'att2']).agg({'att1': "count", 'att3': "sum",'att4': 'mean'})
用你的价值观
df.groupby(['integer_id']).agg({'int_field_1': "sum", 'int_field_2': "sum" })
再补充一点,因为我的情况稍微复杂一点:如果要按多个字段分组,唯一的区别是
df.groupby(['field1','field2']).sum()
df.groupby(['integer_id']).agg({'int_field_1': "sum", 'int_field_2': "sum" })