Hive sparksql:为什么分区列上的in子句导致完全表扫描

Hive sparksql:为什么分区列上的in子句导致完全表扫描,hive,apache-spark-sql,hdfs,Hive,Apache Spark Sql,Hdfs,我想从分区的配置单元表中获取最新的数据,我使用了类似select*from table的sql,其中select maxdate from table t中的date是分区列,但它触发了配置单元全表扫描,为什么sparksql不能查询hdfs目录并获取最大日期,然后只扫描一个分区?我找到了许多答案,解释了如何避免全表扫描,但我真正想知道的是为什么 欢迎来到堆栈溢出!不幸的是,这个问题不够详细,无法为您提供任何有意义的帮助。请编辑您的问题,以包含问题的最小可复制示例,包括样本输入、首选输出和您迄今

我想从分区的配置单元表中获取最新的数据,我使用了类似select*from table的sql,其中select maxdate from table t中的date是分区列,但它触发了配置单元全表扫描,为什么sparksql不能查询hdfs目录并获取最大日期,然后只扫描一个分区?我找到了许多答案,解释了如何避免全表扫描,但我真正想知道的是为什么

欢迎来到堆栈溢出!不幸的是,这个问题不够详细,无法为您提供任何有意义的帮助。请编辑您的问题,以包含问题的最小可复制示例,包括样本输入、首选输出和您迄今为止尝试的代码。另外,由于您有错误,请在问题文本中包含完整的错误回溯。有些人也有相同的问题。你可以试试看这个