Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/276.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python中数据帧的难聚合与汇总_Python_Pandas_Dataframe_Aggregate - Fatal编程技术网

Python中数据帧的难聚合与汇总

Python中数据帧的难聚合与汇总,python,pandas,dataframe,aggregate,Python,Pandas,Dataframe,Aggregate,我有一个如下所示的数据帧: data = pd.DataFrame({"ID" : [1, 2, 3, 22, 3], "Nazwa" : ["aa", "bb", "cc", "dd", "cc"], "L" : [11, 22, 33, 55, 44]}

我有一个如下所示的数据帧:

data = pd.DataFrame({"ID" : [1, 2, 3, 22, 3],
                    "Nazwa" : ["aa", "bb", "cc", "dd", "cc"], 
                    "L" : [11, 22, 33, 55, 44]})

最后,我想用“Nazwa”将这个DF分组,然后用“ID”聚合(sum)。然后我想为“Nazwa”中的每个值总结“ID”,并为这个“Nazwa”总结“L”中的最大值。这可能不够容易理解,因此我在下面列出了我希望基于上表数据实现的表格

将group by与一起使用,以便:

data.groupby(['Nazwa']).agg({'ID':'sum','L':'max'}).reset_index()
预期结果:

   Nazwa    ID  L
0   aa      1   11
1   bb      2   22
2   cc      6   44
3   dd     22   55
如果列的顺序很关键:

data.groupby(['Nazwa']).agg({'ID':'sum','L':'max'}).reset_index()[['ID','Nazwa','L']]
将分组方式与一起使用,以便:

data.groupby(['Nazwa']).agg({'ID':'sum','L':'max'}).reset_index()
预期结果:

   Nazwa    ID  L
0   aa      1   11
1   bb      2   22
2   cc      6   44
3   dd     22   55
如果列的顺序很关键:

data.groupby(['Nazwa']).agg({'ID':'sum','L':'max'}).reset_index()[['ID','Nazwa','L']]

伟大的非常感谢。但是我怎样才能删除索引呢?因为目前我在索引、ID和LI列中有ID和Nazwa,所以reset_index()不起作用?只需执行以下操作:data.index=data['ID'],然后删除列['ID']。完美!非常感谢你我接受了你的回答adhg@谣言我很高兴。欢迎来到SOGreat!非常感谢。但是我怎样才能删除索引呢?因为目前我在索引、ID和LI列中有ID和Nazwa,所以reset_index()不起作用?只需执行以下操作:data.index=data['ID'],然后删除列['ID']。完美!非常感谢你我接受了你的回答adhg@谣言我很高兴。欢迎使用SOBTW,您应该嵌入图像(但最好是复制粘贴表到问题并突出显示为代码)顺便说一句,您应该嵌入图像(但最好是复制粘贴表到问题并突出显示为代码)