Indexing 用于在Apache Drill中查询配置单元的主键或索引

Indexing 用于在Apache Drill中查询配置单元的主键或索引,indexing,hive,primary-key,apache-drill,Indexing,Hive,Primary Key,Apache Drill,在Apache Drill中查询配置单元时,主键或索引是什么,以及如何执行这些查询?从Drill 1.12开始,Drill不利用索引。Drill只是假设没有索引,并吸收所有数据,以一种简单的方式进行计算。在Hive这样的外部系统中,有一些工作可以利用索引的知识,但这项工作正在进行中,尚未成为演练版本的一部分。True。但平心而论,所有大数据查询引擎(Hive、Impala、Drill、Spark……甚至在某种程度上是Oracle Exadata)都有相同的方法来最小化I/O:依赖于(a)分区/b

在Apache Drill中查询配置单元时,主键或索引是什么,以及如何执行这些查询?

从Drill 1.12开始,Drill不利用索引。Drill只是假设没有索引,并吸收所有数据,以一种简单的方式进行计算。在Hive这样的外部系统中,有一些工作可以利用索引的知识,但这项工作正在进行中,尚未成为演练版本的一部分。

True。但平心而论,所有大数据查询引擎(Hive、Impala、Drill、Spark……甚至在某种程度上是Oracle Exadata)都有相同的方法来最小化I/O:依赖于(a)分区/bucketing和(b)“谓词下推”(predicate push down),由柱状格式(如Parquet和ORC)支持。Drill确实支持分区文件,也确实支持谓词下推。但是,它还不支持索引。例如,如果您有一个包含列myCol的数据库表,并且在myCol上定义了一个索引,那么Drill将不会利用该索引执行类似排序的操作。相反,Drill将从表中吸取所有数据并进行排序,即使列上定义了索引。是的,这正是我所说的,没有关于“(c)索引”的内容。。。0 : -)