Hadoop 如何在烫伤中一次平均数几列？_Hadoop_Cascading_Scalding

Hadoop 如何在烫伤中一次平均数几列？

hadoop

Hadoop 如何在烫伤中一次平均数几列？,hadoop,cascading,scalding,Hadoop,Cascading,Scalding,作为滚烫计算的最后一步，我想计算管道中柱的几个平均值。但是下面的代码不起作用 myPipe.groupAll { _average('col1,'col2, 'col3) } 有没有办法不经过几次运算就计算出这样的函数sum、max、average？我很关心性能，但也许滚烫足够聪明，可以通过编程方式检测到这一点。这个问题在论坛上得到了回答。在这里留下答案作为参考 myPipe.groupAll { _.average('col1).average('col2).average('col3) }

作为滚烫计算的最后一步，我想计算管道中柱的几个平均值。但是下面的代码不起作用

myPipe.groupAll { _average('col1,'col2, 'col3) }

有没有办法不经过几次运算就计算出这样的函数

sum、max、average

？我很关心性能，但也许滚烫足够聪明，可以通过编程方式检测到这一点。

这个问题在论坛上得到了回答。在这里留下答案作为参考

myPipe.groupAll { _.average('col1).average('col2).average('col3) }

这个问题在论坛上得到了回答。在这里留下答案作为参考

myPipe.groupAll { _.average('col1).average('col2).average('col3) }

您可以使用下面的函数一次性完成大小（也称为计数）、平均值和标准开发

// Find the count of boys vs. girls, their mean age and standard deviation. 
// The new pipe contains "sex", "count", "meanAge" and "stdevAge" fields.
val demographics = people.groupBy('sex) { _.sizeAveStdev('age -> ('count, 'meanAge, 'stdevAge) ) }

查找max需要另一个过程。

您可以使用下面的函数一次性完成size（又名count）、average和standardDev

// Find the count of boys vs. girls, their mean age and standard deviation. 
// The new pipe contains "sex", "count", "meanAge" and "stdevAge" fields.
val demographics = people.groupBy('sex) { _.sizeAveStdev('age -> ('count, 'meanAge, 'stdevAge) ) }

找到max需要另一个过程。

如果您希望它在一行中，请使用圆括号<代码>myPipe.groupAll（u.average（'col1）.average（'col2）.average（'col3））。大括号应该扩展到3行。@ancehu这在级联中是如何实现的？如果你想在一行中使用大括号<代码>myPipe.groupAll（u.average（'col1）.average（'col2）.average（'col3））。花括号应该扩展到3行。@ancehu在级联中如何实现这一点？