Apache 最大(计数)函数

Apache 最大(计数)函数,apache,hadoop,apache-pig,hadoop-streaming,hadoop-partitioning,Apache,Hadoop,Apache Pig,Hadoop Streaming,Hadoop Partitioning,下面这个程序是我试图用ApachePig原样和非结构化数据来实现的 i) 我有包含街道名称、城市和州的数据集: 二)按国家分组 iii)我正在统计数据集中的状态(*),现在我的o/p将类似于statename,COUNT==>该状态在数据集中的可用时间 节目: realestate = LOAD DATA using pigstorage(',') as (street:string,city string,state string); A = GROUP realestate by stat

下面这个程序是我试图用ApachePig原样和非结构化数据来实现的

i) 我有包含街道名称、城市和州的数据集:

二)按国家分组

iii)我正在统计数据集中的状态(*),现在我的o/p将类似于statename,COUNT==>该状态在数据集中的可用时间

节目:

realestate = LOAD DATA using pigstorage(',') as (street:string,city string,state string);

A = GROUP realestate by state;
B= FOREACH A GENERATE group , count (*)
O/p将类似于

加利福尼亚州,14岁 华盛顿,20

现在我需要最大的(计数)我的输出应该是“华盛顿,20”)


如何继续。请帮助我解决问题

对生成的结果应用
订单
限制

realestate = LOAD DATA using pigstorage(',') as (street:string,city string,state string);
A = GROUP realestate by state;
B = FOREACH A GENERATE group , COUNT(realestate) as c;

# Arrange the tuples based on the count in descending order
D = order B by c desc;

# Apply limit on the ordered result to get the Max value
E = LIMIT D 1;