Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hadoop hive中的聚合和分组_Hadoop_Hive_Hiveql - Fatal编程技术网

Hadoop hive中的聚合和分组

Hadoop hive中的聚合和分组,hadoop,hive,hiveql,Hadoop,Hive,Hiveql,我的表格结构: Date Year Month Code Name 如果我能得到如下结果,那就太好了 Year Month Code CodeCount Name NameCount 结构是这样的,“代码”可以有多个“名称”,但“名称”总是有一个“代码” 如果这不可能,我可以将其分解为两个查询 Year Month Code CodeCount 及 我只是盯着蜂箱,非常感谢您的帮助 谢谢 有了这个,我应该能够执行Select code,Sum

我的表格结构:

Date      Year    Month    Code    Name
如果我能得到如下结果,那就太好了

Year  Month  Code   CodeCount  Name  NameCount
结构是这样的,“代码”可以有多个“名称”,但“名称”总是有一个“代码”

如果这不可能,我可以将其分解为两个查询

Year  Month  Code   CodeCount

我只是盯着蜂箱,非常感谢您的帮助

谢谢


有了这个,我应该能够执行
Select code,Sum(NameCount)
来获取CodeCount

当您按列分组时,您就不能选择其他列以及聚合列。检查下面的配置单元查询以聚合并返回列表中的其他列值
Year  Month  Name  NameCount
select Year,Month,Code,Name,count(*) as NameCount from table group by Year,Month,Code,Name;