Apache pig 将元组划分为多个元组
我有不包含相同数据量的元组:Apache pig 将元组划分为多个元组,apache-pig,Apache Pig,我有不包含相同数据量的元组: (a、b、c、d) (e,f) (g、h、i) 我想做的是为每个数据创建新的元组: (a) (b) (c) (d) (e) (f) (g) (h) (一) 感谢您的帮助假设您有关系a,那么下面的语句将为您提供所需的输出 B = FOREACH A GENERATE FLATTEN(ToBag(*)); 以下是您如何生成所需结果(已测试): 假设你有一个关系中的数据,a A = LOAD 'data file' using PigStorage('
(a、b、c、d)
(e,f)
(g、h、i) 我想做的是为每个数据创建新的元组:
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(一)
感谢您的帮助假设您有关系a,那么下面的语句将为您提供所需的输出
B = FOREACH A GENERATE FLATTEN(ToBag(*));
以下是您如何生成所需结果(已测试): 假设你有一个关系中的数据,a
A = LOAD 'data file' using PigStorage(',');
Next语句将每行转换为一个包,这是下一步生成所需结果所必需的。完成此操作后,每个记录/元组将有一个元素,即一个包
B = foreach A generate TOBAG(*);
展平从袋子中取出每个元素,并将它们放在单独的行中
C = foreach B generate flatten($0);
dump C;
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
C = foreach B generate flatten($0);
dump C;
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)