Hadoop 用给定值替换配置单元表列中的所有值

Hadoop 用给定值替换配置单元表列中的所有值,hadoop,hive,Hadoop,Hive,我有一个架构为- customer_id string country string start_date string end_date string 我想用end_date列中的给定字符串替换所有值,该字符串为yyyy mm dd格式,但存储为字符串 查看配置单元函数,我发现了其中的两个-regexp\u replace和translate。请参阅-@bunny:您将无法使用前面提到的UDF更新现有列。如果要更新列,则必须使用update(前提是配置单元>=0.14,并且表是根据-file

我有一个架构为-

customer_id string
country string
start_date string
end_date string
我想用end_date列中的给定字符串替换所有值,该字符串为yyyy mm dd格式,但存储为字符串


查看配置单元函数,我发现了其中的两个-regexp\u replace和translate。请参阅-

@bunny:您将无法使用前面提到的UDF更新现有列。如果要更新列,则必须使用update(前提是配置单元>=0.14,并且表是根据-fileformat集群bucketing创建的)。我肯定你不是在寻找这种方法

提到的两个UDF(regexp_replace和translate)都用于获得所需的输出,但不替换现有数据

我看到的唯一选项是用更新的列覆盖整个表,您不想看到什么吗?