Hive 配置单元:查询以获取每个日期每个单词的最大计数
以下是我掌握的数据:Hive 配置单元:查询以获取每个日期每个单词的最大计数,hive,hiveql,Hive,Hiveql,以下是我掌握的数据: date | word | count 01/01/2020 #abc 1 01/01/2020 #xyz 2 02/05/2020 #ghi 2 02/05/2020 #def 1 02/04/2020 #pqr 4 02/04/2020 #cde
date | word | count
01/01/2020 #abc 1
01/01/2020 #xyz 2
02/05/2020 #ghi 2
02/05/2020 #def 1
02/04/2020 #pqr 4
02/04/2020 #cde 3
01/01/2020 #lmn 1
以下是我想要的结果:
date | word | count
01/01/2020 #xyz 2
02/04/2020 #pqr 4
02/05/2020 #ghi 2
所以基本上,我想要在每个特定的日期有最大计数的单词。
有人能帮我查询一下吗?使用
行数
窗口函数和分区依据和排序依据
子句,只从分区中选择最大计数
SELECT date,word,count
FROM (
SELECT date,word,count,row_number() over (partition by date order by count desc) as rn
from <table_name>) sq
WHERE sq.rn = 1;
选择日期、字数、计数
从(
选择日期、单词、计数、行数()作为rn(按日期划分顺序按计数描述)
从)sq
其中sq.rn=1;