Hadoop 连接到CDH4.5群集

Hadoop 连接到CDH4.5群集,hadoop,hive,Hadoop,Hive,我有一个CDH4.5群集,我想从另一台服务器(例如数据库服务器)将文件上载到该群集 使用vanilla Hadoop和Hive,我可以更改配置文件,将namenode和metastore指向远程服务,然后只需运行: dba@db-001$ hadoop fs -copyFromLocal /path/to/export.tsv dba@db-001$ hive -e "load data local inpath '/path/to/export.tsv' into table test.my_

我有一个CDH4.5群集,我想从另一台服务器(例如数据库服务器)将文件上载到该群集

使用vanilla Hadoop和Hive,我可以更改配置文件,将namenode和metastore指向远程服务,然后只需运行:

dba@db-001$ hadoop fs -copyFromLocal /path/to/export.tsv
dba@db-001$ hive -e "load data local inpath '/path/to/export.tsv' into table test.my_table"
但是CDH呢?我应该在其他服务器上安装哪些组件

  • 下载与CDH版本对应的hadoop和hive tarball:

  • 从cloudera manager下载配置文件,解压缩它们,并将HADOOP_CONF_DIR/HIVE_CONF_DIR指向这些文件夹