Hive 执行插入覆盖选择时从配置单元中的文件中删除垃圾字符*
我在GCS中有一个配置单元表(90多个列),我正在使用它创建CSV文件:Hive 执行插入覆盖选择时从配置单元中的文件中删除垃圾字符*,hive,hiveql,Hive,Hiveql,我在GCS中有一个配置单元表(90多个列),我正在使用它创建CSV文件: INSERT OVERWRITE DIRECTORY '${GCS_DIR_PATH}' ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' NULL DEFINED AS '' STORED AS TEXTFILE SELECT * FROM ${LKUP_DB_1}.search_keywords_lookup; 在将数据提取为CSV时,我会在任意随机列中获得垃圾字符,如^@(
INSERT OVERWRITE DIRECTORY '${GCS_DIR_PATH}'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
NULL DEFINED AS ''
STORED AS TEXTFILE
SELECT * FROM ${LKUP_DB_1}.search_keywords_lookup;
在将数据提取为CSV时,我会在任意随机列中获得垃圾字符,如^@
(不固定)。是否可以将regexp\u extract
应用于select*FROM
级别,而不是每个列
样本数据:
Adam ^@ Links to Sells Dept ^@^@^@ . ^@^@
欢迎提出任何其他建议
感谢和问候
萨普塔希