Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/apache/8.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache Pig脚本,用于查找每个部门的最大、最小、平均和工资总额_Apache_Hadoop_Apache Pig - Fatal编程技术网

Apache Pig脚本,用于查找每个部门的最大、最小、平均和工资总额

Apache Pig脚本,用于查找每个部门的最大、最小、平均和工资总额,apache,hadoop,apache-pig,Apache,Hadoop,Apache Pig,在按部门编号对数据进行分组后,我陷入了困境。我遵循了以下步骤 grunt> A = load '/home/cloudera/naveen1/hive_data/emp_data.txt' using PigStorage(',') as (eno:int,ename:chararray,job:chararray,sal:float,comm:float,dno:int); grunt> B = group A by don; grunt> describe B; B: {

在按部门编号对数据进行分组后,我陷入了困境。我遵循了以下步骤

grunt> A = load '/home/cloudera/naveen1/hive_data/emp_data.txt' using PigStorage(',') as (eno:int,ename:chararray,job:chararray,sal:float,comm:float,dno:int); 
grunt> B = group A by don;
grunt> describe B;
B: {group: int,A: {(eno: int,ename: chararray,job: chararray,sal: float,comm: float,dno: int)}}
请告诉我这之后的步骤。我对嵌套Foreach语句的执行有点困惑

数据包含eno、ename、sal、job、commisson、deptno和我希望提取每个部门的最大sal以及获得最高工资的员工


与min sal类似。

分组后使用聚合函数

C = FOREACH B GENERATE group,MAX(A.sal),MIN(A.sal),AVG(A.sal),SUM(A.sal);
DUMP C;
要获取每个部门的姓名、eno和max sal,请对记录进行排序并获取最上面一行

C = FOREACH B {
        max_sal = ORDER A BY sal DESC;
        max_limit = LIMIT max_sal 1;
        GENERATE FLATTEN(max_limit);
}
DUMP C;

@问心无愧实际上我在寻找每个部门的名字,伊诺和马克斯·萨尔