Apache pig 如何在Pig中分组输入数据行,保持顺序?
我有按顺序排列的输入数据行,例如 基本上要将它们分组到col1上,但保留col2的顺序:Apache pig 如何在Pig中分组输入数据行,保持顺序?,apache-pig,Apache Pig,我有按顺序排列的输入数据行,例如 基本上要将它们分组到col1上,但保留col2的顺序: {1,{(23,45,12)}} {2,{(74,11,8)}} 标准组(imho)不是作为内袋的选项 {1,{(1,23),{(1,45),(1,12))}不保证23、45、12按该顺序排列。您可以使用秩向每行添加行号,然后在分组后按该顺序排列内部组 A = load 'data' AS (f1:int,f2:int); B = RANK A; A = load 'data' AS (f1:int,f
{1,{(23,45,12)}}
{2,{(74,11,8)}}
标准组(imho)不是作为内袋的选项
{1,{(1,23),{(1,45),(1,12))}
不保证23、45、12按该顺序排列。您可以使用秩向每行添加行号,然后在分组后按该顺序排列内部组
A = load 'data' AS (f1:int,f2:int);
B = RANK A;
A = load 'data' AS (f1:int,f2:int);
B = RANK A;