Apache pig 如何从Pig脚本中分组数据的列列表中获取一个值

Apache pig 如何从Pig脚本中分组数据的列列表中获取一个值,apache-pig,Apache Pig,我使用Pig脚本获取数据,如下所示- 将计数(C)生成为kount、group.methodName、group.pool、MIN(C.time)、MAX(C.time),C.FlowId }; 这里的FlowId(字母数字)是一个列表,其中有多个id对应于不同的方法名,但我只需要一个id,可以是列表中的任意id。 如何使用Pig脚本实现这一点? 那么,基本上在上面的查询中,如何获取单个流Id而不是流Id列表 任何指点都将不胜感激 我尝试使用MAX作为Flow ID,但由于Flow ID是字母数

我使用Pig脚本获取数据,如下所示-

将计数(C)生成为kount、group.methodName、group.pool、MIN(C.time)、MAX(C.time),C.FlowId };

这里的FlowId(字母数字)是一个列表,其中有多个id对应于不同的方法名,但我只需要一个id,可以是列表中的任意id。 如何使用Pig脚本实现这一点? 那么,基本上在上面的查询中,如何获取单个流Id而不是流Id列表

任何指点都将不胜感激

我尝试使用MAX作为Flow ID,但由于Flow ID是字母数字,因此无法工作。

使用-

E=FOREACH D{sorted=order C by time desc;top=limit sorted 1;生成COUNT(C)作为kount、flatte(top)、MIN(C.time);}


展平顶部将具有基于时间的最新流ID

使用-E=FOREACH D{sorted=order C by time desc;top=limit sorted 1;生成计数(C)作为kount,展平(top),MIN(C.time);};扁平顶部将具有基于时间的最新流ID。