Hive 我要数一数这张表有多少人的工资低于平均水平

Hive 我要数一数这张表有多少人的工资低于平均水平,hive,hql,Hive,Hql,这是一个配置单元查询,我试图计算表中有多少记录的收入低于平均工资。首先,根据服务类型将行分配到不同的分区中。在不指定ORDER BY和窗口规格的情况下,默认值为无界前向和无界后向之间的行 然后,将聚合平均值作为分析函数应用于每个窗口,以获得每个分区的平均年平均值。因此,我们可以知道一个记录的年平均值是否低于其分区的平均值 最后,对中间结果集进行计数 选择 服务类型, 苏米斯波夫 从…起 选择 *, 案例 当ANNUALSALARY

这是一个配置单元查询,我试图计算表中有多少记录的收入低于平均工资。首先,根据服务类型将行分配到不同的分区中。在不指定ORDER BY和窗口规格的情况下,默认值为无界前向和无界后向之间的行

然后,将聚合平均值作为分析函数应用于每个窗口,以获得每个分区的平均年平均值。因此,我们可以知道一个记录的年平均值是否低于其分区的平均值

最后,对中间结果集进行计数

选择 服务类型, 苏米斯波夫 从…起 选择 *, 案例 当ANNUALSALARY注意,HAVING子句用于在GROUP BY之后进行筛选,并且在筛选之前会丢失各行的详细信息

选择*,按具有AnnualSalary的服务类型将AnnualSalary计算为评估组中的计数
SELECT
    *, 
    COUNT (AnnualSalary < avg(AnnualSalary)) AS Count 
FROM Assessment 
GROUP BY ServiceType