Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/309.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
我如何将重复类别的频率与';groupby';用Python?_Python_Pandas_Mean_Frequency - Fatal编程技术网

我如何将重复类别的频率与';groupby';用Python?

我如何将重复类别的频率与';groupby';用Python?,python,pandas,mean,frequency,Python,Pandas,Mean,Frequency,[上传] 我正在处理一个大的日期集,现在我已经达到了这一部分: agg_diag = ('mean', 'median', 'count') columns_names_diag = ['ae_diag_mean','ae_diag_median'] df[columns_names_diag].groupby(df['Code']).agg(agg_diag) 作为输出 ae_diag_mean ae_diag_median me

[上传] 我正在处理一个大的日期集,现在我已经达到了这一部分:

agg_diag = ('mean', 'median', 'count')
columns_names_diag = ['ae_diag_mean','ae_diag_median']
df[columns_names_diag].groupby(df['Code']).agg(agg_diag)
作为输出

       ae_diag_mean         ae_diag_median         
       mean median count    mean median count   
Code                                    
04189  82.0  82.0    1      82.0  82.0  1       
07811  14.0  14.0    1      14.0  14.0  1       
07812  3.0   3.0     1      3.0   3.0   1      
0794   0.0   0.0     2      0.0   0.0   2       
0914   4.0   4.0     1      4.0   4.0   1       
然而,由于这个“计数”在这个数据帧的两列中都是重复的,所以我只想为它设置一列。Count是此数据集中存在的每个代码的数量。所以我想要这样的输出:

       ae_diag_mean  ae_diag_median        
       mean median   mean median       count    
Code                                    
04189  82.0  82.0    82.0  82.0          1      
07811  14.0  14.0    14.0  14.0          1      
07812  3.0   3.0     3.0   3.0           1     
0794   0.0   0.0     0.0   0.0           2      
0914   4.0   4.0     4.0   4.0           1      

有人能帮我吗?提前谢谢你

您提供的数据不是一个完全可复制的示例。但是听起来你在找
groupby('code')。size()
@PeterLeimbigler我更新了这个问题,也许你能更好地理解我的意思。这是因为我可以只为count添加一列,您可以发布起始数据以及预期的输出吗?读者现在还没有什么可测试的。同时,您可以尝试两个步骤:首先,运行当前代码,但不通过
'count'
进行聚合。然后,运行
df['count']=df[columns\u names\u diag].groupby('code').count()