Hive 配置单元中要基于分钟部分删除的时间戳列

Hive 配置单元中要基于分钟部分删除的时间戳列,hive,hiveql,Hive,Hiveql,我们有很多csv文件,其中包含数百万数据,通过将12个文件合并为一个文件,然后将数据提供给机器学习团队,这些数据被推送到Hive外部表中 CSV文件是原始文件,其中包含电话号码、Col1、Col2…..创建日期 将12个csv文件合并为一个csv大型csv文件加载到配置单元外部表中 因此,我们要获取的字段是Phonenumber,Created\u dateTimestamp 时间戳应基于hh:mm写入时隙/时间板,不包括日期部分和秒部分 例如,如果hh:mm在00:00到00:15之间,它应该

我们有很多csv文件,其中包含数百万数据,通过将12个文件合并为一个文件,然后将数据提供给机器学习团队,这些数据被推送到Hive外部表中

CSV文件是原始文件,其中包含电话号码、Col1、Col2…..创建日期

将12个csv文件合并为一个csv大型csv文件加载到配置单元外部表中

因此,我们要获取的字段是Phonenumber,Created\u dateTimestamp

时间戳应基于hh:mm写入时隙/时间板,不包括日期部分和秒部分

例如,如果hh:mm在00:00到00:15之间,它应该写1,同样地,如果它在00:15到00:30之间,它应该写2…23:45到00:00,然后写96

所以最终结果应该是这样的 电话号码|时隙/线路板 9999999| 1 8888888| 23

提前感谢朋友们

文卡特

92


1问题不清楚2您似乎对什么外部表isHi Mark有错误的概念,已经编辑了我上面的查询。您好Mark!!谢谢你的快速回复:我会检查一下并让你知道!!不客气。如果它对你有用,请不要忘记接受答案
with t as (select timestamp '2017-03-23 22:47:01' as Created_date) 
select (hour(Created_date)*60 + minute(Created_date)) div 15 + 1 
from t