Apache pig 与pig相互插入关系?

Apache pig 与pig相互插入关系?,apache-pig,Apache Pig,假设我有两个数据集: A = LOAD 'data1' AS (a1:int,a2:int,a3:int); DUMP A; (1,2,3) (4,2,1) (8,3,4) (4,3,3) (7,2,5) (8,4,3) B = LOAD 'data2' AS (b1:int,b2:int); DUMP B; (2,4) (8,9) (1,3) (2,7) (2,9) (4,6) (4,9) 有没有办法将B中的特定元组插入a中?因此最终结果将类似于: DUMP C; (1,2,3) (

假设我有两个数据集:

A = LOAD 'data1' AS (a1:int,a2:int,a3:int);


DUMP A;
(1,2,3)
(4,2,1)
(8,3,4)
(4,3,3)
(7,2,5)
(8,4,3)

B = LOAD 'data2' AS (b1:int,b2:int);

DUMP B;
(2,4)
(8,9)
(1,3)
(2,7)
(2,9)
(4,6)
(4,9)
有没有办法将B中的特定元组插入a中?因此最终结果将类似于:

DUMP C;
(1,2,3)
(2,4)
(4,2,1)
(8,9)
...

您能告诉我们A和B所需的字段以及输出的结构吗?操作中是否涉及主键


如果A和B中有相同的字段,您可以为相同的字段执行。

听起来您在谈论执行联合。如果两个关系共享相同的模式,则可以执行以下操作:

C = UNION A,B;    -- won't work
但是,既然他们没有,你就不能把他们联合起来。但是,您可以更改B的架构,使其与A匹配:

B = FOREACH B GENERATE 
              b1 as a1, 
              b2 as a2,
              0  as a3; -- dummy value so can union

我不知道你选择“特定元组”是什么意思。当然,您可以始终筛选B,使其仅包含符合某些条件的元组。你能提供更多关于你的用例和你想要达到的目标的信息吗?

请说明你尝试过哪些没有奏效的东西。你如何知道你需要
A
B
中的哪些元组?