Hadoop 从csv文件上载到配置单元表的空值
我是hadoop hive的新手。我们正在使用开源hadoop配置单元。它安装在ubuntu的单节点集群上。我在一个csv文件中有一百万行数据,我将它从windows移动到linux。使用愚弄命令将数据上载到配置单元时,会将空值上载到表中Hadoop 从csv文件上载到配置单元表的空值,hadoop,hive,Hadoop,Hive,我是hadoop hive的新手。我们正在使用开源hadoop配置单元。它安装在ubuntu的单节点集群上。我在一个csv文件中有一百万行数据,我将它从windows移动到linux。使用愚弄命令将数据上载到配置单元时,会将空值上载到表中 LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv' OVERWRITE INTO TABLE rejstats; 我甚至试图通过tplace文件hdfs上传这些值,但仍然存在同样的问题 我的
LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv'
OVERWRITE INTO TABLE rejstats;
我甚至试图通过tplace文件hdfs上传这些值,但仍然存在同样的问题
我的表格结构如下:
CREATE TABLE rejstats( amount_requested INT , appdate TIMESTAMP , loan_title STRING , dbt_income_ratio FLOAT , city STRING , state STRING , employment_lenght STRING)
ROW FORMAT
DELIMITED FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;
我正在附上返回的空值的屏幕截图
请大家帮我解决这个问题。多谢各位
问候,,
Divya。我想您正在尝试在一个表中输入一个逗号分隔的文件,您使用的是以“\t”即tab结尾的
字段。请尝试以下操作:
CREATE TABLE rejstats (amount_requested INT , appdate TIMESTAMP ,
loan_title STRING , dbt_income_ratio FLOAT , city STRING ,
state STRING , employment_lenght STRING) ROW FORMAT DELIMITED FIELDS
TERMINATED BY ',' STORED AS TEXTFILE;
LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv'
OVERWRITE INTO TABLE rejstats;
配置单元中是否支持时间戳数据类型?因为我在从包含时间戳数据类型的配置单元表检索数据时遇到错误。配置单元支持时间戳,但默认格式(通过csv从字符串读取时)是YYYY-MM-dd HH:MM:SS.000