Sql 蜂箱中的排序字段

Sql 蜂箱中的排序字段,sql,hadoop,mapreduce,hive,hiveql,Sql,Hadoop,Mapreduce,Hive,Hiveql,我的表中有大约2000-2500万条记录,我必须根据某些条件放入另一个表中,并进行排序。范例 Create table X AS select * from Y where item <> 'ABC' Order By id; 将表X创建为 从Y中选择* 项目“ABC”的位置 按id订购; 我知道Order by使用单个减速机来保证输出的总订单。 我需要优化方法来对上述查询进行排序。这对于注释来说太长了 SQL表表示无序集。在并行数据库中尤其如此,因为数据分布在多个处理器之间

我的表中有大约2000-2500万条记录,我必须根据某些条件放入另一个表中,并进行排序。范例

Create table X AS
select * from Y 
where item <> 'ABC'
Order By id;
将表X创建为
从Y中选择*
项目“ABC”的位置
按id订购;
我知道Order by使用单个减速机来保证输出的总订单。
我需要优化方法来对上述查询进行排序。

这对于注释来说太长了

SQL表表示无序集。在并行数据库中尤其如此,因为数据分布在多个处理器之间

也就是说,Hive支持聚集索引(本质上定义分区)和分区内的排序。但是,非常具体的是,
CREATE TABLE AS
不支持这一点:

CTA有以下限制:

  • 目标表不能是分区表
您可以通过导出数据并重新导入数据来执行所需操作


但是,我建议您在不要求在数据库中对数据进行排序的情况下,找出真正需要的数据。

我不明白。问题是什么?需要对大量数据进行排序的解决方案。而您当前的查询不适用于您,因为。。。?