Hive 如何从hadoop配置单元计算日期列(累计包括今天)的计数(customer_id)
有没有办法在Hive中获取今天的日期以及到今天日期之前的天数的累计countcustomer_id?此格式的日期列: 20120907 我的数据集中有两列,客户id和日期 我的表中也有分区,customer\u id列中的一些值为NULL。我不确定是否有副本,因此我将使用Hive 如何从hadoop配置单元计算日期列(累计包括今天)的计数(customer_id),hive,Hive,有没有办法在Hive中获取今天的日期以及到今天日期之前的天数的累计countcustomer_id?此格式的日期列: 20120907 我的数据集中有两列,客户id和日期 我的表中也有分区,customer\u id列中的一些值为NULL。我不确定是否有副本,因此我将使用 count(distinct(customer_id)) 下面是我的数据示例 customer_id date 10001 20140901 10003 20141001 NULL
count(distinct(customer_id))
下面是我的数据示例
customer_id date
10001 20140901
10003 20141001
NULL 20150101
10007 20150102
如果您需要更多信息,请告诉我。显示您问题的一些示例数据。顺便说一句:你的桌子上有分区吗?谢谢你的快速回复。我确实更新了我的问题,