Apache pig 如何删除pig中的重复列?
我有一张员工桌Apache pig 如何删除pig中的重复列?,apache-pig,Apache Pig,我有一张员工桌 eid | ename | deptno --------------------- 1 | ABC | 10 2 | XYZ | 20 3 | PQR | 10 4 | BCD | 20 5 | CBA | 10 当我尝试使用deptno进行分组时,它会在第二列中显示deptno。如何避免它?一旦分组,您必须迭代元素(使用FOREACH)并使用GENERATE投影数据,以选择您感兴趣的列。 比如: 你到底想要什么,也
eid | ename | deptno
---------------------
1 | ABC | 10
2 | XYZ | 20
3 | PQR | 10
4 | BCD | 20
5 | CBA | 10
当我尝试使用deptno进行分组时,它会在第二列中显示deptno。如何避免它?一旦分组,您必须迭代元素(使用
FOREACH
)并使用GENERATE
投影数据,以选择您感兴趣的列。
比如:
你到底想要什么,也请提一下
res = FOREACH ( GROUP input BY deptno ) {
GENERATE eid, ename
, deptno -- you may remove that line if you do not need deptno anymore
;
}