Mapreduce 如何在蜂巢计数函数的输出上使用Max函数
如何在Mapreduce 如何在蜂巢计数函数的输出上使用Max函数,mapreduce,hive,Mapreduce,Hive,如何在Count函数的输出上使用Max函数。我有一个表candidatenames,列为candidatenames,如下所示 AAA BBB CCC BBB AAA FFF AAA AAA 我希望输出如下: AAA 4 由于AAA出现的次数最多4。如何在配置单元中获取此输出?您可以使用配置单元窗口功能来实现这一点;你可以读到他们 查询: select candidates, c from ( select candidates, c , max(c) over
Count
函数的输出上使用Max
函数。我有一个表candidatenames
,列为candidatenames
,如下所示
AAA
BBB
CCC
BBB
AAA
FFF
AAA
AAA
我希望输出如下:
AAA 4
由于
AAA
出现的次数最多4
。如何在配置单元中获取此输出?您可以使用配置单元窗口功能来实现这一点;你可以读到他们
查询:
select candidates, c
from (
select candidates, c
, max(c) over () max_c
from (
select candidates, count(*) c
from db.table
group by candidates ) x
) y
where max_c = c
candidates c
AAA 4
输出:
select candidates, c
from (
select candidates, c
, max(c) over () max_c
from (
select candidates, count(*) c
from db.table
group by candidates ) x
) y
where max_c = c
candidates c
AAA 4
可能是重复的我遵循了这个链接,但我认为必须有一些更简单的方法来做到这一点。