Hadoop 蜂巢中返回零的百分位_近似值

Hadoop 蜂巢中返回零的百分位_近似值,hadoop,hive,Hadoop,Hive,我一直在尝试检查一组用户的百分比_近似值。这背后的意图是获得数据集中前25%的客户。因此,为了检查这一点,我运行了以下配置单元查询 select percentile_approx(amount, 0.75) from sales 但是,此查询返回的值为0.0。我不确定是什么问题。当我在少数记录的样本上运行此查询时,结果是预期的结果 有人能解释一下吗 注意-我试图在包含超过330万条记录的数据集中找到百分位 select percentile_approx(cast(amount as dou

我一直在尝试检查一组用户的百分比_近似值。这背后的意图是获得数据集中前25%的客户。因此,为了检查这一点,我运行了以下配置单元查询

select percentile_approx(amount, 0.75)
from sales
但是,此查询返回的值为
0.0
。我不确定是什么问题。当我在少数记录的样本上运行此查询时,结果是预期的结果

有人能解释一下吗

注意-我试图在包含超过330万条记录的数据集中找到百分位

select percentile_approx(cast(amount as double), ARRAY(0.75))
from sales

尝试此方法

通常,percentile_approx()适用于整型数据。请确保已将其应用于包含整数的列。

是否可以先尝试使用示例?类似于:
从sales tablesample(0.01%)中选择percentile_Abrox(金额,0.75)
我们可以看到您所做的更改-但解释您的更改可能会解决OP问题的原因总是很有用的。percentile_Abrox()适用于浮点。