基于计数的排名(hiveql)
我想根据会话ID的出现次数对其进行排序,因此第一次出现的次数为1,第二次出现的次数为2,第三次出现的次数为3,以此类推 我得到一个语法错误,所以很可能是出了问题基于计数的排名(hiveql),hive,count,hql,hiveql,window-functions,Hive,Count,Hql,Hiveql,Window Functions,我想根据会话ID的出现次数对其进行排序,因此第一次出现的次数为1,第二次出现的次数为2,第三次出现的次数为3,以此类推 我得到一个语法错误,所以很可能是出了问题 select conversationid, rank() over (partition by conversationid order by count(*) desc) as rnk from my_table group by conversationid 编译语句时出错:失败:SemanticE
select
conversationid,
rank() over (partition by conversationid order by count(*) desc) as rnk
from my_table
group by conversationid
编译语句时出错:失败:SemanticException无法将窗口调用拆分为组。至少有1个组必须仅依赖于输入列。还要检查循环依赖关系。基本错误:org.apache.hadoop.hive.ql.parse.SemanticException:第7:54行尚未支持UDAF“count”的位置如果要按会话的计数对会话进行排序,则不希望在窗口函数中使用
partition by
子句:
select conversationid, rank() over(order by count(*) desc) rnk
from mytable
group by conversationid
这将为最频繁的对话分配秩
1
。您确切地得到了哪个错误?请将这一重要信息包括在内。此外,样本数据和期望的结果将有助于理解您想要实现的目标。刚刚更新,谢谢