Hadoop蜂箱中的计数
我想对映射中类似的值进行计数,其中key是配置单元表列中的值,而对应的值是count 例如,对于下表:Hadoop蜂箱中的计数,hadoop,hive,Hadoop,Hive,我想对映射中类似的值进行计数,其中key是配置单元表列中的值,而对应的值是count 例如,对于下表: +-------+-------+ | Col 1 | Col 2 | +-------+-------+ | Key1 | Val1 | | Key1 | Val2 | | Key2 | Val1 | +-------+-------+ 因此,配置单元查询应该返回如下内容 Key1=2 Key2=1 看起来您正在寻找一个简单的分组方式 SELECT Col1,COUNT(*)
+-------+-------+
| Col 1 | Col 2 |
+-------+-------+
| Key1 | Val1 |
| Key1 | Val2 |
| Key2 | Val1 |
+-------+-------+
因此,配置单元查询应该返回如下内容
Key1=2
Key2=1
看起来您正在寻找一个简单的分组方式
SELECT Col1,COUNT(*)FROM Table GROUP BY Col1
是否有方法进行第二级分组。实际上,我只是以分组查询的形式获取上述输出。你是说按2列分组?您只需按将多个列放入分组中即可。