Hadoop hive中的聚合和分组
我的表格结构:Hadoop hive中的聚合和分组,hadoop,hive,hiveql,Hadoop,Hive,Hiveql,我的表格结构: Date Year Month Code Name 如果我能得到如下结果,那就太好了 Year Month Code CodeCount Name NameCount 结构是这样的,“代码”可以有多个“名称”,但“名称”总是有一个“代码” 如果这不可能,我可以将其分解为两个查询 Year Month Code CodeCount 及 我只是盯着蜂箱,非常感谢您的帮助 谢谢 有了这个,我应该能够执行Select code,Sum
Date Year Month Code Name
如果我能得到如下结果,那就太好了
Year Month Code CodeCount Name NameCount
结构是这样的,“代码”可以有多个“名称”,但“名称”总是有一个“代码”
如果这不可能,我可以将其分解为两个查询
Year Month Code CodeCount
及
我只是盯着蜂箱,非常感谢您的帮助
谢谢
有了这个,我应该能够执行
Select code,Sum(NameCount)
来获取CodeCount当您按列分组时,您就不能选择其他列以及聚合列。检查下面的配置单元查询以聚合并返回列表中的其他列值
Year Month Name NameCount
select Year,Month,Code,Name,count(*) as NameCount from table group by Year,Month,Code,Name;