Hadoop 如何将csv文件数据加载到CDH?

Hadoop 如何将csv文件数据加载到CDH?,hadoop,cloudera,cloudera-cdh,bigdata,Hadoop,Cloudera,Cloudera Cdh,Bigdata,我有多个csv文件,我想将它们导入CDH表。我想知道是否有像sqoop这样的工具可以从文件导入数据。有什么方法或工具可以自动完成吗?标准方法是: CREATE TABLE Something (id int, name string, salary double, ....) row format delimited fields terminated by ‘,’; LOAD DATA LOCAL INPATH '/home/yourcsvfile.csv' OVERWRITE INTO T

我有多个csv文件,我想将它们导入CDH表。我想知道是否有像sqoop这样的工具可以从文件导入数据。有什么方法或工具可以自动完成吗?

标准方法是:

CREATE TABLE Something (id int, name string, salary double, ....) row format delimited fields terminated by ‘,’;

LOAD DATA LOCAL INPATH '/home/yourcsvfile.csv' OVERWRITE INTO TABLE Something;
标准方法是:

CREATE TABLE Something (id int, name string, salary double, ....) row format delimited fields terminated by ‘,’;

LOAD DATA LOCAL INPATH '/home/yourcsvfile.csv' OVERWRITE INTO TABLE Something;

您可以使用Web UI

使用文件浏览器菜单将文件上载到hdfs

之后,您可以使用数据浏览器/元存储表


创建新架构/使用上载的文件创建新表

您可以使用色调Web UI

使用文件浏览器菜单将文件上载到hdfs

之后,您可以使用数据浏览器/元存储表


创建新架构/使用上载的文件创建新表

一,。我不需要将文件加载到hdfs吗?2。这会正确加载所有数据吗(我有int、string、timestamp)?3。我有不止一个文件。我应该只重复第二个命令吗。我应该用黑斑羚还是蜂箱。我不需要将文件加载到hdfs吗?2。这会正确加载所有数据吗(我有int、string、timestamp)?3。我有不止一个文件。我应该只重复第二个命令吗。我应该用黑斑羚还是蜂箱?