Statistics 蜂巢统计
我试图计算ORC文件的统计数据,但我看不到PART_COL_统计数据的任何变化,以及使用Statistics 蜂巢统计,statistics,hive,Statistics,Hive,我试图计算ORC文件的统计数据,但我看不到PART_COL_统计数据的任何变化,以及使用 set hive.compute.query.using.stats=true; set hive.stats.reliable=true; set hive.stats.fetch.column.stats=true; set hive.stats.fetch.partition.stats=true; set hive.cbo.enable=true; 要获取列的最大值,它正在对列运行full Map
set hive.compute.query.using.stats=true;
set hive.stats.reliable=true;
set hive.stats.fetch.column.stats=true;
set hive.stats.fetch.partition.stats=true;
set hive.cbo.enable=true;
要获取列的最大值,它正在对列运行full Map REDUCT。。
我想使用的是元存储中存储的最大值,但我无法捕获这些统计数据
我的表格描述是:
load_inst_id int
src_filename string
server_date date
analyze table mytable partition(server_date=’2013-11-30′) compute statistics for columns load_inst_id;
我的分析查询是:
load_inst_id int
src_filename string
server_date date
analyze table mytable partition(server_date=’2013-11-30′) compute statistics for columns load_inst_id;
我总是得到0作为loadinstant id,我必须关闭我的hive.compute.query.using.stats以获得正确的结果(通过map reduce max(load_inst_id))