Hive 配置单元表定义-多个空间分隔符

Hive 配置单元表定义-多个空间分隔符,hive,field,delimiter,space,Hive,Field,Delimiter,Space,我正在定义一个配置单元表,其中数据在每个字段之间有1到n个空格。 在这种情况下,如何定义分隔符值 我最初将该表定义为: CREATE EXTERNAL TABLE rtt ( field1 STRING, field2 STRING, field3 STRING, field4 STRING, field5 STRING, field6 INT, field7 FLOAT) COMMENT 'New data set' PARTITIONED BY (year INT, month INT,

我正在定义一个配置单元表,其中数据在每个字段之间有1到n个空格。 在这种情况下,如何定义分隔符值

我最初将该表定义为:

CREATE EXTERNAL TABLE rtt (
field1 STRING,
field2 STRING,
field3 STRING,
field4 STRING,
field5 STRING,
field6 INT,
field7 FLOAT)
COMMENT 'New data set'

PARTITIONED BY (year INT, month INT, day INT)

ROW FORMAT DELIMITED 

FIELDS TERMINATED BY ' '

LINES TERMINATED BY '\n'

STORED AS INPUTFORMAT 'com.hadoop.mapred.DeprecatedLzoTextInputFormat'

OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'

LOCATION '/test-dir/raw/2014/08/07/';

请尝试正则表达式SERDE,例如,如中所述


我认为要用作分隔符的正则表达式是“\s+”

请尝试正则表达式SERDE,例如,如中所述

我认为要用作分隔符的正则表达式是“\s+”