Apache pig 用Pig拉丁语查找三元组

Apache pig 用Pig拉丁语查找三元组,apache-pig,Apache Pig,有可能在Pig中找到三重数据集吗?假设您的数据是: bag1 Apple bag1 Orange bag2 Apple bag2 Orange bag2 Pineapple bag3 Apple bag3 Orange bag3 Pineapple bag4 Orange bag5 Apple bag5 Banana 在上面的数据中,我想计算每个袋子里(苹果、橘子、菠萝)的出现次数,这在袋子2和袋子3中发生两次。这可能吗?A=使用PigStorage(“”)作为(袋子:Chararray,水果

有可能在Pig中找到三重数据集吗?假设您的数据是:

bag1 Apple
bag1 Orange
bag2 Apple
bag2 Orange
bag2 Pineapple
bag3 Apple
bag3 Orange
bag3 Pineapple
bag4 Orange
bag5 Apple
bag5 Banana

在上面的数据中,我想计算每个袋子里(苹果、橘子、菠萝)的出现次数,这在袋子2和袋子3中发生两次。这可能吗?

A=使用PigStorage(“”)作为(袋子:Chararray,水果:Chararray)加载“BAG.csv”

B=A组乘以0美元

C=按计数(A)=3筛选B

D=每个C生成组,A.$1作为果实


倾倒区D

您是否尝试过按行李列分组,然后使用行李计数。