Hadoop 如何将数据传递到pig关系
请让我知道我们是否可以将一个特定的关系字段加载到另一个字段中,如下所示Hadoop 如何将数据传递到pig关系,hadoop,Hadoop,请让我知道我们是否可以将一个特定的关系字段加载到另一个字段中,如下所示 usergroup = GROUP input BY user; output = FOREACH usergroup { intermediate = input.traid; distinctdata = DISTINCT intermediate; GENERATE group as user,count(distinctdata);
usergroup = GROUP input BY user;
output = FOREACH usergroup {
intermediate = input.traid;
distinctdata = DISTINCT intermediate;
GENERATE group as user,count(distinctdata); };
不能将特定的关系字段加载到另一个字段中 据我所知,您需要区分
input.traid的值,然后对其进行计数
在这里,对于每个用户的count(distinctdata)
,您总是会得到1
。为什么要将其作为输出
DISTINCT
不适用于特定列(字段),但用于元组(行)
它删除重复的元组