Hive 如果我运行配置单元查询仅从最新分区获取数据,查询是否会执行完整表扫描?

Hive 如果我运行配置单元查询仅从最新分区获取数据,查询是否会执行完整表扫描?,hive,Hive,如果我的配置单元表是在一个名为data\u loading\u date的列上分区的。如果我运行一个查询仅从最新分区获取数据,该查询是否会执行完整表扫描? 但这里要注意的关键点是,最新的分区将由查询本身标识(即使用表a中的select max(数据加载日期)) 查询类似于: select * from table_A where data_loading_date in ( select max(data_loading_date) from table_A ); 您可以运行exp

如果我的配置单元表是在一个名为data\u loading\u date的列上分区的。如果我运行一个查询仅从最新分区获取数据,该查询是否会执行完整表扫描? 但这里要注意的关键点是,最新的分区将由查询本身标识(即使用表a中的select max(数据加载日期)) 查询类似于:

select *  
from table_A 
where data_loading_date in (
   select max(data_loading_date) from table_A
);

您可以运行
explain select*…
,并检查生成的查询计划。这是分区工作的地方,它不会扫描整个表。它将只访问条件中提到的分区