Hive 如何通过查询获取组的最大值

Hive 如何通过查询获取组的最大值,hive,cqlsh,Hive,Cqlsh,这是我的数据集: 00000000040112 2702 00000000040112 AVAILABLE 1566921227223 -6.0 LB 00000000040112 2702 00000000040112 AVAILABLE 1566921247222 -9.0 LB 00030400791888 6065 00030400791888 AVAILABLE 1566919

这是我的数据集:

00000000040112    2702      00000000040112  AVAILABLE       1566921227223   -6.0    LB
00000000040112    2702      00000000040112  AVAILABLE       1566921247222   -9.0    LB
00030400791888    6065      00030400791888  AVAILABLE       1566919357992   45.0    EA
00030400791888    6065      00030400791888  AVAILABLE       1566919547809   72.0    EA 
我试图从每组中获得最大值,因此根据上述数据,预期结果如下:

00000000040112  2702    00000000040112  AVAILABLE       1566921247222   -9.0    LB 
00030400791888  6065    00030400791888  AVAILABLE       1566919547809   72.0    EA
我的查询没有产生正确的结果,是:

select  
  primegtin, nodeid, gtin, inventory_state, 
  max(last_updated_time), 
  quantity_by_gtin, quantity_uom 
from pit_by_prime_gtin 
where 
  year=2019 and month =8 and day =27 and hour=15 
group by 
  primegtin, nodeid, gtin, inventory_state, 
  last_updated_time, 
  quantity_by_gtin, quantity_uom ;

它可能有什么问题?

您需要从
group by
子句中删除正在聚合的列

在您的示例中,它可能类似于:

选择
primegtin、nodeid、gtin、库存状态、,
最大值(上次更新时间),
最大值(单位数量),单位数量
来自pit_by_Primegtin
哪里
年=2019,月=8,日=27,小时=15
分组
primegtin、nodeid、gtin、库存状态、,
数量单位;

Hi Sumith-有点不清楚,请添加列名。另外,您的查询得到了什么输出