Hadoop 群集不与cdh4 tarball安装一起工作

Hadoop 群集不与cdh4 tarball安装一起工作,hadoop,cloudera,Hadoop,Cloudera,我正在尝试使用tarball版本安装CDH4,但在我采取的步骤中面临的问题如下: 我从linkhttps://ccp.cloudera.com/display/SUPPORT/CDH4+可下载+柏油球 我首先解压hadoop-0.20-mapreduce-0.20.2+1341 tar文件 我在中更改了配置 hadoop-0.20-mapreduce-0.20.2+1341 since i wanted mrv1 not yarn . cdh4安装中提到的第一件事是配置HDFS 我做了相关的

我正在尝试使用tarball版本安装CDH4,但在我采取的步骤中面临的问题如下:

我从link
https://ccp.cloudera.com/display/SUPPORT/CDH4+可下载+柏油球

我首先解压hadoop-0.20-mapreduce-0.20.2+1341 tar文件

我在中更改了配置

hadoop-0.20-mapreduce-0.20.2+1341  since i wanted mrv1 not yarn .
cdh4安装中提到的第一件事是配置HDFS

我做了相关的修改

core-site.xml
hdfs-site.xml
mapred-site.xml
masters --- which is my namenode
slaves ---- my datanodes
已在群集中的所有节点上复制hadoop配置

执行了namenode格式

格式化后我不得不启动集群,但在bin文件夹中无法启动

查找start-all.sh脚本。所以在这种情况下,我从命令开始

bin/start-mapred.sh
在日志中,它显示从节点上启动的jobtracker和tasktracker 但是当我做jps的时候

我只能看见

jobtracker
jps
接下来,使用下面的命令在datanode上启动了datanode

bin/hadoop-daemon.sh start datanode .
它显示datanode已启动

Namenode未启动,tasktracker未启动

当我查看日志时,我可以看到

ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: Exception in namenode join
java.io.FileNotFoundException: webapps/hdfs not found in CLASSPATH
不确定是什么使我的群集停止工作

早些时候,我有一个cdh3运行。所以我停止了cdh3集群。然后我开始安装cdh4。此外,我还更改了所有目录hdfs-site.xml,即为namenode和datanode指出了新的空目录,而不是使用cdh3中定义的目录

但似乎仍然没有任何帮助

此外,我关闭了防火墙,因为我有根访问权限,但同样的事情,它并没有为我工作

上面的任何帮助都将是巨大的帮助


谢谢你的回复,但是

我没有

start-dfs.sh file in bin folder 
只有/home/hadoop-2.0.0-mr1-cdh4.2.0/bin文件夹中的文件如下

start-mapred.sh
stop-mapred.sh
hadoop-daemon.sh
hadoop-daemons.sh
hadoop-config.sh
rcc
slaves.sh
hadoop
我现在使用的命令如下

要启动datanode,请执行以下操作:

for x in /home/hadoop-2.0.0-mr1-cdh4.2.0/bin/hadoop-* ; do $x start datanode ; done ;
对于启动namenode:

bin/start-mapred.sh

我仍在处理相同的问题。

运行命令后,jobtrackerdemon将在主节点中启动,tasktrakerdemons将在每个数据节点中启动

bin/start-mapred.sh
Hadoop集群设置中只有jobtackerdemon将通过主节点中的JPS命令显示,并且在您的每个数据节点中,您可以通过使用JPS命令看到运行的Tasktrackerdemons

然后,您必须在masternode中运行以下命令来启动HDFS

bin/start-dfs.sh
此命令将启动namenode机器中的namenode恶魔(我相信在这种配置中,主节点本身就是恶魔),并且Datanode恶魔将在每个从节点中启动

现在,您可以在每个DataNode上运行JPS,它将提供输出

tasktracker
datanode
jps
我认为这个链接是有用的

您好,很抱歉出现上述误解,可以运行以下命令来启动datanodes和namenode

要启动namenode,请执行以下操作:

hadoop-daemon.sh  start namenode 
要启动datanode,请执行以下操作:

hadoop-daemons.sh  start datanode 
要启动secondarynamenode,请执行以下操作:

hadoop-daemon.sh  start namenode 
hadoop-daemons.sh --hosts masters start secondarynamenode