我如何将重复类别的频率与';groupby';用Python?
[上传] 我正在处理一个大的日期集,现在我已经达到了这一部分:我如何将重复类别的频率与';groupby';用Python?,python,pandas,mean,frequency,Python,Pandas,Mean,Frequency,[上传] 我正在处理一个大的日期集,现在我已经达到了这一部分: agg_diag = ('mean', 'median', 'count') columns_names_diag = ['ae_diag_mean','ae_diag_median'] df[columns_names_diag].groupby(df['Code']).agg(agg_diag) 作为输出 ae_diag_mean ae_diag_median me
agg_diag = ('mean', 'median', 'count')
columns_names_diag = ['ae_diag_mean','ae_diag_median']
df[columns_names_diag].groupby(df['Code']).agg(agg_diag)
作为输出
ae_diag_mean ae_diag_median
mean median count mean median count
Code
04189 82.0 82.0 1 82.0 82.0 1
07811 14.0 14.0 1 14.0 14.0 1
07812 3.0 3.0 1 3.0 3.0 1
0794 0.0 0.0 2 0.0 0.0 2
0914 4.0 4.0 1 4.0 4.0 1
然而,由于这个“计数”在这个数据帧的两列中都是重复的,所以我只想为它设置一列。Count是此数据集中存在的每个代码的数量。所以我想要这样的输出:
ae_diag_mean ae_diag_median
mean median mean median count
Code
04189 82.0 82.0 82.0 82.0 1
07811 14.0 14.0 14.0 14.0 1
07812 3.0 3.0 3.0 3.0 1
0794 0.0 0.0 0.0 0.0 2
0914 4.0 4.0 4.0 4.0 1
有人能帮我吗?提前谢谢你 您提供的数据不是一个完全可复制的示例。但是听起来你在找
groupby('code')。size()
@PeterLeimbigler我更新了这个问题,也许你能更好地理解我的意思。这是因为我可以只为count添加一列,您可以发布起始数据以及预期的输出吗?读者现在还没有什么可测试的。同时,您可以尝试两个步骤:首先,运行当前代码,但不通过'count'
进行聚合。然后,运行df['count']=df[columns\u names\u diag].groupby('code').count()