Hadoop 在配置单元中生成唯一ID_Hadoop_Hash_Hive_Identifier

Hadoop 在配置单元中生成唯一ID

hadoop hash hive

Hadoop 在配置单元中生成唯一ID,hadoop,hash,hive,identifier,Hadoop,Hash,Hive,Identifier,我一直在尝试为表的每一行（3000多万行）生成唯一的ID 由于Hadoop的并行性，使用序列号显然不起作用内置的UDF rand（）和hash（rand（），unixtime（））似乎会产生冲突必须有一种简单的方法来生成行ID，我想知道是否有人有解决方案我的下一步就是创建一个Java map reduce作业，以生成一个真正的哈希字符串，其中包含一个安全的随机+主机IP+当前时间作为种子。但我想在做这件事之前我应该先问一下；）不确定这是否有帮助，但接下来考虑本机MapReduce

我一直在尝试为表的每一行（3000多万行）生成唯一的ID

由于Hadoop的并行性，使用序列号显然不起作用
内置的UDF rand（）和hash（rand（），unixtime（））似乎会产生冲突

必须有一种简单的方法来生成行ID，我想知道是否有人有解决方案

我的下一步就是创建一个Java map reduce作业，以生成一个真正的哈希字符串，其中包含一个安全的随机+主机IP+当前时间作为种子。但我想在做这件事之前我应该先问一下；）