基于bash中的字段值合并列

基于bash中的字段值合并列,bash,shell,scripting,awk,Bash,Shell,Scripting,Awk,我正在处理的输入数据集如下所示 我试图做的是在每分钟(第一个字段)的基础上整合数据。第二列值应取平均值,第三列值应求和 因此,我的输出应该如下所示: 23:21,74.285714,199924 23:21,80.000000,627377 23:21,82.857143,499796 23:22,85.714286,670676 23:22,87.428571,149860 23:22,88.000000,301272 上面的值是样本,不是真正的总和或平均值,但这是要点。我现在正试图用awk

我正在处理的输入数据集如下所示

我试图做的是在每分钟(第一个字段)的基础上整合数据。第二列值应取平均值,第三列值应求和

因此,我的输出应该如下所示:

23:21,74.285714,199924
23:21,80.000000,627377
23:21,82.857143,499796
23:22,85.714286,670676
23:22,87.428571,149860
23:22,88.000000,301272
上面的值是样本,不是真正的总和或平均值,但这是要点。我现在正试图用awk实现这一点,有更好的选择吗?

您可以试试awk:

23:21,78,127377
23:22,87,105678
awk -F, '{a[$1]+=$2; b[$1]+=$3; c[$1]++}
          END {for (i in a) print i, int(a[i]/c[i]), b[i]}' OFS=, file
23:21,79,1327097
23:22,87,1121808