Hive 如何通过查询获取组的最大值
这是我的数据集:Hive 如何通过查询获取组的最大值,hive,cqlsh,Hive,Cqlsh,这是我的数据集: 00000000040112 2702 00000000040112 AVAILABLE 1566921227223 -6.0 LB 00000000040112 2702 00000000040112 AVAILABLE 1566921247222 -9.0 LB 00030400791888 6065 00030400791888 AVAILABLE 1566919
00000000040112 2702 00000000040112 AVAILABLE 1566921227223 -6.0 LB
00000000040112 2702 00000000040112 AVAILABLE 1566921247222 -9.0 LB
00030400791888 6065 00030400791888 AVAILABLE 1566919357992 45.0 EA
00030400791888 6065 00030400791888 AVAILABLE 1566919547809 72.0 EA
我试图从每组中获得最大值,因此根据上述数据,预期结果如下:
00000000040112 2702 00000000040112 AVAILABLE 1566921247222 -9.0 LB
00030400791888 6065 00030400791888 AVAILABLE 1566919547809 72.0 EA
我的查询没有产生正确的结果,是:
select
primegtin, nodeid, gtin, inventory_state,
max(last_updated_time),
quantity_by_gtin, quantity_uom
from pit_by_prime_gtin
where
year=2019 and month =8 and day =27 and hour=15
group by
primegtin, nodeid, gtin, inventory_state,
last_updated_time,
quantity_by_gtin, quantity_uom ;
它可能有什么问题?您需要从
group by
子句中删除正在聚合的列
在您的示例中,它可能类似于:
选择
primegtin、nodeid、gtin、库存状态、,
最大值(上次更新时间),
最大值(单位数量),单位数量
来自pit_by_Primegtin
哪里
年=2019,月=8,日=27,小时=15
分组
primegtin、nodeid、gtin、库存状态、,
数量单位;
Hi Sumith-有点不清楚,请添加列名。另外,您的查询得到了什么输出