Hive 配置单元计数的结果不正确
与使用where子句时相比,我在对表进行完全计数时得到的计数不正确。结果如下:Hive 配置单元计数的结果不正确,hive,hortonworks-data-platform,Hive,Hortonworks Data Platform,与使用where子句时相比,我在对表进行完全计数时得到的计数不正确。结果如下: SELECT count(1) FROM Table_MAS MAS; OK 11317322 hive> SELECT count(1) FROM Table_MAS where Col_A IS NOT NULL and Col_B is NOT NULL; OK 552589106 我已经对表进行了分析和修复。看起来没有什么问题 想看看是否有其他人也遇到过类似的情况,如果有,你是如何纠正的 我已经对表
SELECT count(1) FROM Table_MAS MAS;
OK
11317322
hive> SELECT count(1) FROM Table_MAS where Col_A IS NOT NULL and Col_B is NOT NULL;
OK
552589106
我已经对表进行了分析和修复。看起来没有什么问题
想看看是否有其他人也遇到过类似的情况,如果有,你是如何纠正的
我已经对表进行了分析和修复
显然,我希望where子句的计数始终等于或小于完整计数。您应该使用:
select count(*) FROM Table_MAS MAS;
COUNT(*)将计算行数,而COUNT(1)将计算表达式中的非空值,COUNT(column)将计算列中的所有非空值