Apache pig 如何使用Apache Pig正确聚合唯一计数?

Apache pig 如何使用Apache Pig正确聚合唯一计数?,apache-pig,Apache Pig,我正在使用这样一个简单的数据集: Item-Sold Date Desk A 2/1/2014 Desk A 2/1/2014 Desk A 2/1/2014 Desk A 2/1/2014 Desk B 2/1/2014 Desk C 2/1/2014 Chair A 2/2/2014 Chair B 2/2/2014 Chair B 2/2/2014 我需要帮助编写一个pigla

我正在使用这样一个简单的数据集:

Item-Sold      Date
Desk A       2/1/2014
Desk A       2/1/2014
Desk A       2/1/2014
Desk A       2/1/2014
Desk B       2/1/2014
Desk C       2/1/2014
Chair A      2/2/2014
Chair B      2/2/2014
Chair B      2/2/2014
我需要帮助编写一个piglatin查询,以查找按日期销售的唯一商品的#

因此,我的输出是:

Date      Unique-Items-Sold
2/1/2014         3
2/2/2014         2
我在创建正确的语句时遇到了困难。正在寻求帮助。多谢各位

    --unique_count.pig
    items = LOAD 'items.csv' using PigStorage(',') AS (item,date);
    grpd = GROUP items BY date;
    distinct_cnt = FOREACH grpd {
              it = items.item;
              unique_it = distinct it;
              GENERATE group, COUNT(unique_it);
    };
    DUMP distinct_cnt;
希望这有帮助