HADOOP_主页和HADOOP流媒体

HADOOP_主页和HADOOP流媒体,hadoop,hadoop-streaming,Hadoop,Hadoop Streaming,您好,我正在尝试在安装了hadoop的服务器上运行hadoop,但我不知道hadoop所在的目录。服务器由服务器管理员配置 为了加载hadoop,我使用dotkit包中的use命令 可能有几种解决方案,但想知道hadoop包安装在哪里,如何设置$hadoop_HOME变量,以及如何批准运行hadoop流作业,例如$hadoop_HOME/bin/hadoop jar$hadoop_HOME/mapred/contrib/streaming/hadoop-streaming.jar,aka,htt

您好,我正在尝试在安装了hadoop的服务器上运行hadoop,但我不知道hadoop所在的目录。服务器由服务器管理员配置

为了加载hadoop,我使用dotkit包中的use命令

可能有几种解决方案,但想知道hadoop包安装在哪里,如何设置$hadoop_HOME变量,以及如何批准运行hadoop流作业,例如$hadoop_HOME/bin/hadoop jar$hadoop_HOME/mapred/contrib/streaming/hadoop-streaming.jar,aka,
http://wiki.apache.org/hadoop/HadoopStreaming


谢谢!任何帮助都将不胜感激

如果您使用的是cloudera发行版,那么它很可能位于
/usr/lib/hadoop
中,否则它可能位于任何地方(由系统管理员决定)

您可以使用一些技巧来尝试定位它:

  • locate hadoop env.sh
    (假设locate已经安装并且最近运行了updatedb)
  • 如果运行此操作的计算机正在运行hadoop服务(例如数据节点、作业跟踪器、任务跟踪器、名称节点),则可以为hadoop命令执行进程列表和grep:
    ps axww | grep hadoop
  • 如果以上两种方法都失败,请在一些常见位置查找hadoop根目录,例如:
    /usr/lib
    /usr/local
    /opt
  • 如果所有这些都失败,并假设您的当前用户拥有以下权限:
    find/-name hadoop env.sh
  • 你为什么不试试:

    echo$HADOOP\u HOME


    显然,必须先设置上面的env变量,然后才能从盒子上的任何位置发布hadoop可执行文件。

    如果您是使用rpm安装的,那么它很可能位于
    /etc/hadoop