在Hadoop配置单元中计数并显示超过给定数值的结果
我想对映射中类似的值进行计数,其中key是配置单元表列中的值,而对应的值是count。计数大于给定的num在Hadoop配置单元中计数并显示超过给定数值的结果,hadoop,hive,hiveql,Hadoop,Hive,Hiveql,我想对映射中类似的值进行计数,其中key是配置单元表列中的值,而对应的值是count。计数大于给定的numx 比如说,, 查询: 结果: Key1=2 Key2=1 给定的numx=2。 因此,配置单元查询应返回如下内容: Key1=2. 说明: Key1=2 >=2 (ok) Key2=1 <2 (not ok) Key1=2>=2(正常) Key2=1Map将像{“Key1”:2}一样显示,如果需要Key1=2,则使用concat(Col1,'=',cnt)而不是Map(
x
比如说,,
查询:
结果:
Key1=2
Key2=1
给定的numx=2
。
因此,配置单元查询应返回如下内容:
Key1=2.
说明:
Key1=2 >=2 (ok)
Key2=1 <2 (not ok)
Key1=2>=2(正常)
Key2=1Map将像{“Key1”:2}
一样显示,如果需要Key1=2
,则使用concat(Col1,'=',cnt)
而不是Map()
:
Key1=2 >=2 (ok)
Key2=1 <2 (not ok)
select map(Col1, cnt) as mymap
from(
SELECT Col1, COUNT(*) cnt
FROM Table
GROUP BY Col1
HAVING count(*)>=2 --Magic number filter here
)s;