Apache pig 在PIG中计算列中相同的条目

Apache pig 在PIG中计算列中相同的条目,apache-pig,Apache Pig,我有一个如下所示的数据集。如何使用PIG计算左列中重复值的次数,以获得如下输出。我尝试使用COUNT()函数失败 输入: (h,2007) (h,2008) (h,2009) (n,2009) (b,2005) (b,2006) (b,2007) (b,2008) (b,2009) (d,2007) (d,2005) (d,2006) 输出: (h,3) (n,1) (b,5) (d,3) 非常感谢您的帮助A=data;B=组数据乘以A.$0;C=每个B生成组,将(B)计数为计数组;转储C;

我有一个如下所示的数据集。如何使用PIG计算左列中重复值的次数,以获得如下输出。我尝试使用COUNT()函数失败

输入:

(h,2007)
(h,2008)
(h,2009)
(n,2009)
(b,2005)
(b,2006)
(b,2007)
(b,2008)
(b,2009)
(d,2007)
(d,2005)
(d,2006)
输出:

(h,3)
(n,1)
(b,5)
(d,3)

非常感谢您的帮助

A=data;B=组数据乘以A.$0;C=每个B生成组,将(B)计数为计数组;转储C;您有一个包含数据的变量。然后按数据集中的第一个元素分组。生成组,并计算组中有多少项。根据数据的格式化/命名方式,将更改分组依据,因此可能不是。$0/