Mapreduce 阿帕奇猪学生分数平均计算
我有一个格式为的数据集Mapreduce 阿帕奇猪学生分数平均计算,mapreduce,apache-pig,Mapreduce,Apache Pig,我有一个格式为的数据集 student_id|name|subject|marks 2 John English 50 3 mark Maths 50 3 mark English 50 这些数据被加载到HDFS中,我需要计算每个使用pig的学生的所有科目的平均值,pig的方法是什么 按学生分组并获得平均值。假设您已将数据加载到关系A B = GROUP A BY (student); C = FOREACH B GE
student_id|name|subject|marks
2 John English 50
3 mark Maths 50
3 mark English 50
这些数据被加载到HDFS中,我需要计算每个使用pig的学生的所有科目的平均值,pig的方法是什么 按学生分组并获得平均值。假设您已将数据加载到关系A
B = GROUP A BY (student);
C = FOREACH B GENERATE group,AVG(A.marks);
DUMP C;