Hadoop 如何在烫伤中一次平均数几列?

Hadoop 如何在烫伤中一次平均数几列?,hadoop,cascading,scalding,Hadoop,Cascading,Scalding,作为滚烫计算的最后一步,我想计算管道中柱的几个平均值。但是下面的代码不起作用 myPipe.groupAll { _average('col1,'col2, 'col3) } 有没有办法不经过几次运算就计算出这样的函数sum、max、average?我很关心性能,但也许滚烫足够聪明,可以通过编程方式检测到这一点。这个问题在论坛上得到了回答。在这里留下答案作为参考 myPipe.groupAll { _.average('col1).average('col2).average('col3) }

作为滚烫计算的最后一步,我想计算管道中柱的几个平均值。但是下面的代码不起作用

myPipe.groupAll { _average('col1,'col2, 'col3) }

有没有办法不经过几次运算就计算出这样的函数
sum、max、average
?我很关心性能,但也许滚烫足够聪明,可以通过编程方式检测到这一点。

这个问题在论坛上得到了回答。在这里留下答案作为参考

myPipe.groupAll { _.average('col1).average('col2).average('col3) }

这个问题在论坛上得到了回答。在这里留下答案作为参考

myPipe.groupAll { _.average('col1).average('col2).average('col3) }
您可以使用下面的函数一次性完成大小(也称为计数)、平均值和标准开发

// Find the count of boys vs. girls, their mean age and standard deviation. 
// The new pipe contains "sex", "count", "meanAge" and "stdevAge" fields.
val demographics = people.groupBy('sex) { _.sizeAveStdev('age -> ('count, 'meanAge, 'stdevAge) ) }
查找max需要另一个过程。

您可以使用下面的函数一次性完成size(又名count)、average和standardDev

// Find the count of boys vs. girls, their mean age and standard deviation. 
// The new pipe contains "sex", "count", "meanAge" and "stdevAge" fields.
val demographics = people.groupBy('sex) { _.sizeAveStdev('age -> ('count, 'meanAge, 'stdevAge) ) }

找到max需要另一个过程。

如果您希望它在一行中,请使用圆括号<代码>myPipe.groupAll(u.average('col1).average('col2).average('col3))。大括号应该扩展到3行。@ancehu这在级联中是如何实现的?如果你想在一行中使用大括号<代码>myPipe.groupAll(u.average('col1).average('col2).average('col3))。花括号应该扩展到3行。@ancehu在级联中如何实现这一点?