Sorting 烫伤中groupBy的分类输出
我试图使用烫伤对groupBy语句的输出进行排序 我的数据集如下所示Sorting 烫伤中groupBy的分类输出,sorting,twitter,group-by,scalding,Sorting,Twitter,Group By,Scalding,我试图使用烫伤对groupBy语句的输出进行排序 我的数据集如下所示 Src Eqid Version Datetime Lat Lon Magnitude Depth NST Region ci 15214001 0 Tuesday, September 11, 2012 12:31:37 UTC 33.0110 -115.53
Src Eqid Version Datetime Lat Lon Magnitude Depth NST Region
ci 15214001 0 Tuesday, September 11, 2012 12:31:37 UTC 33.0110 -115.5330 1.3 2.20 18 Southern California
ci 15213993 0 Tuesday, September 11, 2012 12:23:34 UTC 35.3713 -118.5395 2.6 2.40 55 Central California
这就是我一直在尝试的
.sourceFromArg(args, "input").read
.groupBy('Region) { _.average('Magnitude -> 'avgMag) }
.project('Region, 'avgMag)
.write(sourceFromArg(args, "output"))
我知道我能做到
.sortBy(field)
在groupBy中,但我无法根据所需字段(即avgMag)进行排序
关于如何根据平均大小进行排序,您有什么想法吗?这种方法有效,但需要第二个groupBy
.groupBy('Region) { _.average('Magnitude -> 'avgMag) }
.insert('dummy, 1)
.groupBy('dummy) { _.sortBy('avgMag).reverse }
.project('Region, 'avgMag)
.write(sourceFromArg(args, "output"))