Python中数据帧的难聚合与汇总
我有一个如下所示的数据帧:Python中数据帧的难聚合与汇总,python,pandas,dataframe,aggregate,Python,Pandas,Dataframe,Aggregate,我有一个如下所示的数据帧: data = pd.DataFrame({"ID" : [1, 2, 3, 22, 3], "Nazwa" : ["aa", "bb", "cc", "dd", "cc"], "L" : [11, 22, 33, 55, 44]}
data = pd.DataFrame({"ID" : [1, 2, 3, 22, 3],
"Nazwa" : ["aa", "bb", "cc", "dd", "cc"],
"L" : [11, 22, 33, 55, 44]})
最后,我想用“Nazwa”将这个DF分组,然后用“ID”聚合(sum)。然后我想为“Nazwa”中的每个值总结“ID”,并为这个“Nazwa”总结“L”中的最大值。这可能不够容易理解,因此我在下面列出了我希望基于上表数据实现的表格
将group by与一起使用,以便:
data.groupby(['Nazwa']).agg({'ID':'sum','L':'max'}).reset_index()
预期结果:
Nazwa ID L
0 aa 1 11
1 bb 2 22
2 cc 6 44
3 dd 22 55
如果列的顺序很关键:
data.groupby(['Nazwa']).agg({'ID':'sum','L':'max'}).reset_index()[['ID','Nazwa','L']]
将分组方式与一起使用,以便:
data.groupby(['Nazwa']).agg({'ID':'sum','L':'max'}).reset_index()
预期结果:
Nazwa ID L
0 aa 1 11
1 bb 2 22
2 cc 6 44
3 dd 22 55
如果列的顺序很关键:
data.groupby(['Nazwa']).agg({'ID':'sum','L':'max'}).reset_index()[['ID','Nazwa','L']]
伟大的非常感谢。但是我怎样才能删除索引呢?因为目前我在索引、ID和LI列中有ID和Nazwa,所以reset_index()不起作用?只需执行以下操作:data.index=data['ID'],然后删除列['ID']。完美!非常感谢你我接受了你的回答adhg@谣言我很高兴。欢迎来到SOGreat!非常感谢。但是我怎样才能删除索引呢?因为目前我在索引、ID和LI列中有ID和Nazwa,所以reset_index()不起作用?只需执行以下操作:data.index=data['ID'],然后删除列['ID']。完美!非常感谢你我接受了你的回答adhg@谣言我很高兴。欢迎使用SOBTW,您应该嵌入图像(但最好是复制粘贴表到问题并突出显示为代码)顺便说一句,您应该嵌入图像(但最好是复制粘贴表到问题并突出显示为代码)