Apache pig 如何删除pig中的重复列?

Apache pig 如何删除pig中的重复列?,apache-pig,Apache Pig,我有一张员工桌 eid | ename | deptno --------------------- 1 | ABC | 10 2 | XYZ | 20 3 | PQR | 10 4 | BCD | 20 5 | CBA | 10 当我尝试使用deptno进行分组时,它会在第二列中显示deptno。如何避免它?一旦分组,您必须迭代元素(使用FOREACH)并使用GENERATE投影数据,以选择您感兴趣的列。 比如: 你到底想要什么,也

我有一张员工桌

eid | ename  | deptno
---------------------
1   | ABC    | 10
2   | XYZ    | 20 
3   | PQR    | 10 
4   | BCD    | 20 
5   | CBA    | 10

当我尝试使用deptno进行分组时,它会在第二列中显示deptno。如何避免它?

一旦分组,您必须迭代元素(使用
FOREACH
)并使用
GENERATE
投影数据,以选择您感兴趣的列。 比如:


你到底想要什么,也请提一下
res = FOREACH ( GROUP input BY deptno ) {
    GENERATE eid, ename
        , deptno -- you may remove that line if you do not need deptno anymore
    ;
}