Mapreduce 如何在蜂巢计数函数的输出上使用Max函数

Mapreduce 如何在蜂巢计数函数的输出上使用Max函数,mapreduce,hive,Mapreduce,Hive,如何在Count函数的输出上使用Max函数。我有一个表candidatenames,列为candidatenames,如下所示 AAA BBB CCC BBB AAA FFF AAA AAA 我希望输出如下: AAA 4 由于AAA出现的次数最多4。如何在配置单元中获取此输出?您可以使用配置单元窗口功能来实现这一点;你可以读到他们 查询: select candidates, c from ( select candidates, c , max(c) over

如何在
Count
函数的输出上使用
Max
函数。我有一个表
candidatenames
,列为
candidatenames
,如下所示

AAA  
BBB
CCC
BBB
AAA
FFF
AAA
AAA
我希望输出如下:

AAA 4

由于
AAA
出现的次数最多
4
。如何在配置单元中获取此输出?

您可以使用配置单元窗口功能来实现这一点;你可以读到他们

查询

select candidates, c
from (
    select candidates, c
        , max(c) over () max_c
    from (
        select candidates, count(*) c
        from db.table
        group by candidates ) x
    ) y
where max_c = c
candidates    c
AAA           4
输出

select candidates, c
from (
    select candidates, c
        , max(c) over () max_c
    from (
        select candidates, count(*) c
        from db.table
        group by candidates ) x
    ) y
where max_c = c
candidates    c
AAA           4

可能是重复的我遵循了这个链接,但我认为必须有一些更简单的方法来做到这一点。