Hadoop 从csv文件上载到配置单元表的空值

Hadoop 从csv文件上载到配置单元表的空值,hadoop,hive,Hadoop,Hive,我是hadoop hive的新手。我们正在使用开源hadoop配置单元。它安装在ubuntu的单节点集群上。我在一个csv文件中有一百万行数据,我将它从windows移动到linux。使用愚弄命令将数据上载到配置单元时,会将空值上载到表中 LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv' OVERWRITE INTO TABLE rejstats; 我甚至试图通过tplace文件hdfs上传这些值,但仍然存在同样的问题 我的

我是hadoop hive的新手。我们正在使用开源hadoop配置单元。它安装在ubuntu的单节点集群上。我在一个csv文件中有一百万行数据,我将它从windows移动到linux。使用愚弄命令将数据上载到配置单元时,会将空值上载到表中

LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv' 
OVERWRITE INTO TABLE rejstats;
我甚至试图通过tplace文件hdfs上传这些值,但仍然存在同样的问题

我的表格结构如下:

CREATE TABLE rejstats( amount_requested INT , appdate TIMESTAMP , loan_title STRING , dbt_income_ratio FLOAT , city STRING , state STRING , employment_lenght STRING)
ROW FORMAT
DELIMITED FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;
我正在附上返回的空值的屏幕截图

请大家帮我解决这个问题。多谢各位

问候,,
Divya。

我想您正在尝试在一个表中输入一个逗号分隔的文件,您使用的是以“\t”即tab结尾的
字段。请尝试以下操作:

CREATE TABLE rejstats (amount_requested INT , appdate TIMESTAMP , 
loan_title STRING , dbt_income_ratio FLOAT , city STRING , 
state STRING , employment_lenght STRING) ROW FORMAT DELIMITED FIELDS 
TERMINATED BY ',' STORED AS TEXTFILE;

LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv' 
OVERWRITE INTO TABLE rejstats;

配置单元中是否支持时间戳数据类型?因为我在从包含时间戳数据类型的配置单元表检索数据时遇到错误。配置单元支持时间戳,但默认格式(通过csv从字符串读取时)是
YYYY-MM-dd HH:MM:SS.000