Join 使用PIG连接两个具有公共行的不同表

Join 使用PIG连接两个具有公共行的不同表,join,apache-pig,Join,Apache Pig,假设我有两个数据集。 DS1: a 1 b 2 C3 d 4 e 5 DS2: 一通 2失败 三通 四通 5失败 我想得到如下输出: 一传 b 2失败 C3通行证 d 4通行证 e 5失败 现在我的问题是,我应该使用什么pig命令来获得所需的输出?。假设文件中的数据以制表符分隔 A = LOAD 'ds1' USING PigStorage('\t') AS (a1:charrarray,a2:int); B = LOAD 'ds2' USING PigStorage('\t') AS (b1:

假设我有两个数据集。 DS1: a 1 b 2 C3 d 4 e 5

DS2: 一通 2失败 三通 四通 5失败

我想得到如下输出: 一传 b 2失败 C3通行证 d 4通行证 e 5失败

现在我的问题是,我应该使用什么pig命令来获得所需的输出?

。假设文件中的数据以制表符分隔

A = LOAD 'ds1' USING PigStorage('\t') AS (a1:charrarray,a2:int);
B = LOAD 'ds2' USING PigStorage('\t') AS (b1:int,a2:chararray);
C = JOIN A BY a2, B BY b1;
D = FOREACH C GENERATE C.$0,C.$1,B.$1;
DUMP D;