Java 无误启动hadoop,但可以';无法连接到服务器

Java 无误启动hadoop,但可以';无法连接到服务器,java,hadoop,ssh,Java,Hadoop,Ssh,我开始使用hadoop,并阅读了大量教程,以了解第一次启动hadoop的所有步骤。 我正在运行一个从yahoo教程下载的虚拟机,其中预装了hadoop和java 我的主要问题是: 如果我启动start all.sh脚本(在hadoop namenode-format之后),我没有收到任何错误,但是当我尝试使用hadoop fs ls连接到文件系统时,我会收到以下错误: 14/07/18 04:49:43信息ipc.客户端:正在重试连接到服务器:节点1/10.10.104.68:9000。已尝试

我开始使用hadoop,并阅读了大量教程,以了解第一次启动hadoop的所有步骤。 我正在运行一个从yahoo教程下载的虚拟机,其中预装了hadoop和java

我的主要问题是: 如果我启动
start all.sh
脚本(在
hadoop namenode-format
之后),我没有收到任何错误,但是当我尝试使用
hadoop fs ls
连接到文件系统时,我会收到以下错误:


14/07/18 04:49:43信息ipc.客户端:正在重试连接到服务器:节点1/10.10.104.68:9000。已尝试了0次。
.....
14/07/18 04:49:52信息ipc.客户端:重试连接到服务器:节点1/10.10.104.68:9000。已尝试了9次。
与FS的连接不正确。命令中止。异常:对节点1/10.10.104.68:9000的调用在连接上失败异常:java.net.ConnectException:连接被拒绝

在试图找到这个问题的解决方案时,我发现了以下奇怪的事情:

1.)运行
stop all.sh后,它写入:

没有工作追踪者可以停止
节点1:没有要停止的tasktracker
没有要停止的名称节点
node1:正在停止datanode
localhost:正在停止secondarynamenode

2.)netstat在端口9000上没有显示任何侦听内容,为什么

3.)当我尝试通过我的“主”pc连接时(也在停止后),hadoop的webinterface(在IP:50070和:50030上)总是在运行,为什么

所以,它的开头显然不正确,但我真的不知道为什么。。。 我已配置并再次检查:

  • 主机文件
  • ssh配置
  • 我在core-site.xml、hdfs-site.xml中设置的属性;从属文件只有节点1作为条目
  • 所有目录的权限(我也不使用tmp文件夹)
很遗憾,由于代理权限,我无法安装任何新软件包
jps
不起作用(我认为预安装的java版本不支持它!?)而且
ps aux | grep java
的结果对我来说没有多大意义


我会很高兴知道为什么它可能不起作用,或者任何我应该尝试的暗示

首先,我要转到logs文件夹,检查hadoop守护进程的日志。你会明白为什么他们没有开始。守护进程无法启动的原因有很多;找不到JAVA_主页,找不到HADOOP_主页等。日志将为您指明正确的方向。每个守护进程(namenode、datanode、jobtracker等)都有一个日志文件。我首先从namenode日志开始。如果namenode不快乐,那么没有人快乐


确保所有设备都安装在您认为合适的位置。并确保hadoop shell脚本知道如何找到这些位置。

现在开始,我遇到了一个问题,一个端口已经在使用中(从日志文件中)。。。这不是其他(有用的)程序,而是一个挂起的java进程。在杀死所有正在运行的java进程之后,namenode启动成功。