Apache pig 如何使用Apache Pig正确聚合唯一计数?
我正在使用这样一个简单的数据集:Apache pig 如何使用Apache Pig正确聚合唯一计数?,apache-pig,Apache Pig,我正在使用这样一个简单的数据集: Item-Sold Date Desk A 2/1/2014 Desk A 2/1/2014 Desk A 2/1/2014 Desk A 2/1/2014 Desk B 2/1/2014 Desk C 2/1/2014 Chair A 2/2/2014 Chair B 2/2/2014 Chair B 2/2/2014 我需要帮助编写一个pigla
Item-Sold Date
Desk A 2/1/2014
Desk A 2/1/2014
Desk A 2/1/2014
Desk A 2/1/2014
Desk B 2/1/2014
Desk C 2/1/2014
Chair A 2/2/2014
Chair B 2/2/2014
Chair B 2/2/2014
我需要帮助编写一个piglatin查询,以查找按日期销售的唯一商品的#
因此,我的输出是:
Date Unique-Items-Sold
2/1/2014 3
2/2/2014 2
我在创建正确的语句时遇到了困难。正在寻求帮助。多谢各位
--unique_count.pig
items = LOAD 'items.csv' using PigStorage(',') AS (item,date);
grpd = GROUP items BY date;
distinct_cnt = FOREACH grpd {
it = items.item;
unique_it = distinct it;
GENERATE group, COUNT(unique_it);
};
DUMP distinct_cnt;
希望这有帮助