Indexing 用于在Apache Drill中查询配置单元的主键或索引_Indexing_Hive_Primary Key_Apache Drill

Indexing 用于在Apache Drill中查询配置单元的主键或索引

indexing hive

Indexing 用于在Apache Drill中查询配置单元的主键或索引,indexing,hive,primary-key,apache-drill,Indexing,Hive,Primary Key,Apache Drill,在Apache Drill中查询配置单元时，主键或索引是什么，以及如何执行这些查询？从Drill 1.12开始，Drill不利用索引。Drill只是假设没有索引，并吸收所有数据，以一种简单的方式进行计算。在Hive这样的外部系统中，有一些工作可以利用索引的知识，但这项工作正在进行中，尚未成为演练版本的一部分。True。但平心而论，所有大数据查询引擎（Hive、Impala、Drill、Spark……甚至在某种程度上是Oracle Exadata）都有相同的方法来最小化I/O：依赖于（a）分区/b

在Apache Drill中查询配置单元时，主键或索引是什么，以及如何执行这些查询？

从Drill 1.12开始，Drill不利用索引。Drill只是假设没有索引，并吸收所有数据，以一种简单的方式进行计算。在Hive这样的外部系统中，有一些工作可以利用索引的知识，但这项工作正在进行中，尚未成为演练版本的一部分。

True。但平心而论，所有大数据查询引擎（Hive、Impala、Drill、Spark……甚至在某种程度上是Oracle Exadata）都有相同的方法来最小化I/O：依赖于（a）分区/bucketing和（b）“谓词下推”（predicate push down），由柱状格式（如Parquet和ORC）支持。Drill确实支持分区文件，也确实支持谓词下推。但是，它还不支持索引。例如，如果您有一个包含列myCol的数据库表，并且在myCol上定义了一个索引，那么Drill将不会利用该索引执行类似排序的操作。相反，Drill将从表中吸取所有数据并进行排序，即使列上定义了索引。是的，这正是我所说的，没有关于“（c）索引”的内容。。。0 : -)