在Hadoop中按时间和日期筛选

在Hadoop中按时间和日期筛选,hadoop,hive,apache-pig,hiveql,Hadoop,Hive,Apache Pig,Hiveql,我有一个数据表,其中日期和时间作为两个单独的字段,其中日期格式为 dd/mm/yyyy和dd-mm-yyy和时间格式类似于hh:mm:sseg:6:52:53 我需要过滤特定时间段的记录,该时间段包括时间和日期过滤 hive或pig是否提供任何预定义的过滤器 配置单元确实将某些字符串识别为unixtime日期 您可以在将时间和日期合并为unixtime格式时尝试where条件 有关配置单元日期函数/格式的一些文档位于此处:我想您有一列具有两种日期格式,即dd/mm/yyyy和dd-mm-yyyy

我有一个数据表,其中日期和时间作为两个单独的字段,其中日期格式为

dd/mm/yyyy和dd-mm-yyy和时间格式类似于hh:mm:sseg:6:52:53

我需要过滤特定时间段的记录,该时间段包括时间和日期过滤


hive或pig是否提供任何预定义的过滤器

配置单元确实将某些字符串识别为unixtime日期

您可以在将时间和日期合并为unixtime格式时尝试where条件


有关配置单元日期函数/格式的一些文档位于此处:

我想您有一列具有两种日期格式,即dd/mm/yyyy和dd-mm-yyyy

你能试试什么 1将“/”替换为“-”,以便完整列采用dd-mm-yyyy格式。 2尝试将此字段与时间字段关联 3通过浇铸混凝土场进行过滤。
希望这有帮助。

只是可能性:-您是否尝试过将连接字段强制转换为日期数据类型,然后尝试使用日期函数以获得所需的输出? 到目前为止

更新cdr_数据集TD=根据您的指令选择从cdr_数据开始的时间,7,-,4,2,-,4,2,-,1,2,使用子字符串和连接操作,根据配置单元时间戳更改日期格式,select语句提供了所需的时间格式,但无法将值直接更新到表中,有什么方法可以做到这一点吗?