Hadoop ApachePig-错误2229:cand';找不到项目的匹配uid-1

Hadoop ApachePig-错误2229:cand';找不到项目的匹配uid-1,hadoop,apache-pig,cloudera-cdh,Hadoop,Apache Pig,Cloudera Cdh,我在运行Pig脚本时遇到以下异常 错误2229:找不到项目(名称:project)的匹配uid-1 类型:bytearray Uid:-1输入:0列:12) 原因可能是什么?我查看了脚本的扩展版和替换版,从语法角度看没有任何错误。这是0.11.1版(CDH 4.3)中Pig Optimizer中的一个错误。这似乎与优化以下简化脚本的尝试有关 LOAD A -- Primary Driver Table LOAD B LOAD C J1 = JOIN A LEFT, B J2 = JOIN J2

我在运行Pig脚本时遇到以下异常

错误2229:找不到项目(名称:project)的匹配uid-1 类型:bytearray Uid:-1输入:0列:12)


原因可能是什么?我查看了脚本的扩展版和替换版,从语法角度看没有任何错误。

这是0.11.1版(CDH 4.3)中Pig Optimizer中的一个错误。这似乎与优化以下简化脚本的尝试有关

LOAD A  -- Primary Driver Table
LOAD B
LOAD C
J1 = JOIN A LEFT, B
J2 = JOIN J2 LEFT, C
LOAD D
J3 = JOIN J2, D -- Inner Join
理想情况下,如果A更早地与D连接,那么流经连接J1和J2的数据可能会减少,从而加快速度

我猜这种优化尝试失败了

消除此bug的一种方法是确定如何“提升”脚本中较早发生的joinj3(内部连接)

LOAD A  -- Primary Driver Table
LOAD B
LOAD C
J1 = JOIN A LEFT, B
J2 = JOIN J2 LEFT, C
LOAD D
J3 = JOIN J2, D -- Inner Join