Sql 运行GroupBy时的配置单元排序
我有一个包含如下数据的配置单元表: 蜂箱台 分区,id,序号,原始Sql 运行GroupBy时的配置单元排序,sql,hive,Sql,Hive,我有一个包含如下数据的配置单元表: 蜂箱台 分区,id,序号,原始 xm1, aaa, 3, <end> xm1, aaa, 2, <middle> xm1, aab, 1, <begin> xm1, aaa, 1, <begin> xm1, aab, 3, <end> xm1, aab, 2, <middle> 您可以尝试使用sort_数组内置函数对collect_set的结果执行排序 请注意,根据,sort_array
xm1, aaa, 3, <end>
xm1, aaa, 2, <middle>
xm1, aab, 1, <begin>
xm1, aaa, 1, <begin>
xm1, aab, 3, <end>
xm1, aab, 2, <middle>
您可以尝试使用sort_数组内置函数对collect_set的结果执行排序
请注意,根据,sort_array函数从Hive 0.9.0开始可用,希望您的安装不早于此。从SQL返回的数据应该是分区,id[],返回的数据以随机顺序发送收集的_集[]我在原始SQL中有一个复制错误。收集集合正在收集原始字段。
SELECT partition, id, collect_set(raw)
FROM test_rpt_sorted
WHERE id='aaa'
GROUP BY partition, id
SELECT partition, id, sort_array(collect_set(seq))
FROM test_rpt_sorted
WHERE id='aaa'
GROUP BY partition, id;