Sorting 如何在Impala中查询已排序/索引的列
我必须使用Hadoop为一个数据库制作一个POC,使用交互式查询(~300ToLogDatabase)我正在尝试Impala,但我没有找到任何使用排序或索引数据的解决方案。我是个新手,所以我甚至不知道这是否可能 如何查询Impala中已排序/索引的列? 顺便说一下,这是我的表的代码(简化)。 我想快速访问下面的“列到列排序”Sorting 如何在Impala中查询已排序/索引的列,sorting,hadoop,indexing,impala,Sorting,Hadoop,Indexing,Impala,我必须使用Hadoop为一个数据库制作一个POC,使用交互式查询(~300ToLogDatabase)我正在尝试Impala,但我没有找到任何使用排序或索引数据的解决方案。我是个新手,所以我甚至不知道这是否可能 如何查询Impala中已排序/索引的列? 顺便说一下,这是我的表的代码(简化)。 我想快速访问下面的“列到列排序” 更多信息:无论我是否在配置单元中对表进行排序/索引/存储桶,此表上的Impala查询读取的字节数都是相同的。我没有找到其他使用排序的方法。我猜测解决方案是:我可以对列进行散
更多信息:无论我是否在配置单元中对表进行排序/索引/存储桶,此表上的Impala查询读取的字节数都是相同的。我没有找到其他使用排序的方法。我猜测解决方案是:我可以对列进行散列和分区,而不是对数据进行排序,或者使用一种可以索引数据的压缩格式
CREATE TABLE IF NOT EXISTS myTable (
unique_id STRING,
column_to_sort INT,
content STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\073'
STORED AS textfile;