Apache pig 将元组划分为多个元组

Apache pig 将元组划分为多个元组,apache-pig,Apache Pig,我有不包含相同数据量的元组: (a、b、c、d) (e,f) (g、h、i) 我想做的是为每个数据创建新的元组: (a) (b) (c) (d) (e) (f) (g) (h) (一) 感谢您的帮助假设您有关系a,那么下面的语句将为您提供所需的输出 B = FOREACH A GENERATE FLATTEN(ToBag(*)); 以下是您如何生成所需结果(已测试): 假设你有一个关系中的数据,a A = LOAD 'data file' using PigStorage('

我有不包含相同数据量的元组:
(a、b、c、d)
(e,f)
(g、h、i)

我想做的是为每个数据创建新的元组:
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(一)


感谢您的帮助

假设您有关系a,那么下面的语句将为您提供所需的输出

B = FOREACH A GENERATE FLATTEN(ToBag(*));

以下是您如何生成所需结果(已测试):

假设你有一个关系中的数据,a

A  = LOAD 'data file' using PigStorage(',');
Next语句将每行转换为一个包,这是下一步生成所需结果所必需的。完成此操作后,每个记录/元组将有一个元素,即一个包

 B = foreach A generate TOBAG(*);
展平从袋子中取出每个元素,并将它们放在单独的行中

C = foreach B generate flatten($0);

dump C;
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
C = foreach B generate flatten($0);

dump C;
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)