Hive 如何在配置单元表创建中指定字符串作为分隔符
我的数据如下所示: a|b|c 要获取数据,我的create table语句是: 创建表 (col1字符串 col2字符串 col3(字符串) 以“| |”结尾的行格式分隔字段 但在这里,它将“|”作为分隔符,而不是“| |” 有人能帮我吗?处理多字符分隔符字符串时可以使用:Hive 如何在配置单元表创建中指定字符串作为分隔符,hive,delimiter,Hive,Delimiter,我的数据如下所示: a|b|c 要获取数据,我的create table语句是: 创建表 (col1字符串 col2字符串 col3(字符串) 以“| |”结尾的行格式分隔字段 但在这里,它将“|”作为分隔符,而不是“| |” 有人能帮我吗?处理多字符分隔符字符串时可以使用: create table mytable ( col1 string, col2 string, col3 string ) ROW FORMAT SERDE 'org.apache.hadoop.hive.c
create table mytable (
col1 string,
col2 string,
col3 string
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
"input.regex" = "^([^\\|]+)\\|\\|([^\\|]+)\\|\\|([^\\|]+)$",
"output.format.string" = "%1$s %2$s %3$s")
STORED AS TEXTFILE
LOCATION '/path/to/data';
注意:根据您的需要优化正则表达式
字段
只需支持字符
。因此不支持|
。看见