Sql 蜂箱中的排序字段_Sql_Hadoop_Mapreduce_Hive_Hiveql

Sql 蜂箱中的排序字段

sql hadoop mapreduce hive

Sql 蜂箱中的排序字段,sql,hadoop,mapreduce,hive,hiveql,Sql,Hadoop,Mapreduce,Hive,Hiveql,我的表中有大约2000-2500万条记录，我必须根据某些条件放入另一个表中，并进行排序。范例 Create table X AS select * from Y where item <> 'ABC' Order By id; 将表X创建为从Y中选择* 项目“ABC”的位置按id订购；我知道Order by使用单个减速机来保证输出的总订单。我需要优化方法来对上述查询进行排序。这对于注释来说太长了 SQL表表示无序集。在并行数据库中尤其如此，因为数据分布在多个处理器之间

我的表中有大约2000-2500万条记录，我必须根据某些条件放入另一个表中，并进行排序。范例

Create table X AS
select * from Y 
where item <> 'ABC'
Order By id;

将表X创建为
从Y中选择*
项目“ABC”的位置
按id订购；

我知道Order by使用单个减速机来保证输出的总订单。

我需要优化方法来对上述查询进行排序。

这对于注释来说太长了

SQL表表示无序集。在并行数据库中尤其如此，因为数据分布在多个处理器之间

也就是说，Hive支持聚集索引（本质上定义分区）和分区内的排序。但是，非常具体的是，

CREATE TABLE AS

不支持这一点：

CTA有以下限制：

目标表不能是分区表

您可以通过导出数据并重新导入数据来执行所需操作

但是，我建议您在不要求在数据库中对数据进行排序的情况下，找出真正需要的数据。

我不明白。问题是什么？需要对大量数据进行排序的解决方案。而您当前的查询不适用于您，因为。。。？