Hive 如何从hadoop配置单元计算日期列(累计包括今天)的计数(customer_id)

Hive 如何从hadoop配置单元计算日期列(累计包括今天)的计数(customer_id),hive,Hive,有没有办法在Hive中获取今天的日期以及到今天日期之前的天数的累计countcustomer_id?此格式的日期列: 20120907 我的数据集中有两列,客户id和日期 我的表中也有分区,customer\u id列中的一些值为NULL。我不确定是否有副本,因此我将使用 count(distinct(customer_id)) 下面是我的数据示例 customer_id date 10001 20140901 10003 20141001 NULL

有没有办法在Hive中获取今天的日期以及到今天日期之前的天数的累计countcustomer_id?此格式的日期列:

20120907

我的数据集中有两列,客户id和日期

我的表中也有分区,customer\u id列中的一些值为NULL。我不确定是否有副本,因此我将使用

count(distinct(customer_id))
下面是我的数据示例

customer_id  date
10001         20140901
10003         20141001
NULL          20150101
10007         20150102

如果您需要更多信息,请告诉我。

显示您问题的一些示例数据。顺便说一句:你的桌子上有分区吗?谢谢你的快速回复。我确实更新了我的问题,