Apache pig 在一定条件下如何连接Pig中的两个表

Apache pig 在一定条件下如何连接Pig中的两个表,apache-pig,Apache Pig,我有两个表——表A(人名,人名工资),表B(人名,商店,商店)和一个公共列名人名。我想在公共列上连接这两个表,但只取salary>1000的行。我想为每个薪水超过1000英镑的人输出商店列表。表B列出了单个店铺所在的店铺列表,这意味着同一个人每次都有多行店铺名称不同或重复。 我想知道如何在合并表时实现薪资条件加载两个数据集。根据薪资>1000筛选第一个数据集。在人名上合并两个数据集以获得输出 A = LOAD 'dataA.txt' USING PigStorage(',') AS (name:

我有两个表——表A(人名,人名工资),表B(人名,商店,商店)和一个公共列名人名。我想在公共列上连接这两个表,但只取salary>1000的行。我想为每个薪水超过1000英镑的人输出商店列表。表B列出了单个店铺所在的店铺列表,这意味着同一个人每次都有多行店铺名称不同或重复。
我想知道如何在合并表时实现薪资条件加载两个数据集。根据薪资>1000筛选第一个数据集。在人名上合并两个数据集以获得输出

A = LOAD 'dataA.txt' USING PigStorage(',') AS (name:chararray,salary:int);
B = LOAD 'dataB.txt' USING PigStorage(',') AS (name:chararray,store:int);
C = FILTER A BY (salary > 1000);
D = JOIN C BY name,B BY name;
E = FOREACH D GENERATE C.name,B.store;
DUMP E;

分享你迄今为止所做的尝试。这个似乎不起作用。错误日志显示作业失败,hadoop不返回任何错误消息。我认为最后一行关于关系E有一些问题