在伪分布式hadoop模式下管理HDF

在伪分布式hadoop模式下管理HDF,hadoop,hdfs,Hadoop,Hdfs,我想在我的四核机器上用hadoop和mahout进行一些计算,所以我在伪分布式模式下使用hadoop 问题是我的根drve上的空间有限,因此如何配置它以使用其他外部硬盘上的可用空间。您可以配置hdfs存储数据的位置。将以下内容添加到conf/hdfs-site.xml中: <property> <name>dfs.data.dir</name> <value>__path_to_where_you_want_to_store_you

我想在我的四核机器上用hadoop和mahout进行一些计算,所以我在伪分布式模式下使用hadoop


问题是我的根drve上的空间有限,因此如何配置它以使用其他外部硬盘上的可用空间。

您可以配置hdfs存储数据的位置。将以下内容添加到conf/hdfs-site.xml中:

<property>
    <name>dfs.data.dir</name>
    <value>__path_to_where_you_want_to_store_your_data/hdfs/data/</value>
</property>
<property>
    <name>dfs.name.dir</name>
    <value>__path_to_where_you_want_to_store_your_data/hdfs/name/</value>
</property>

dfs.data.dir
__路径\到\您希望\存储\您的\数据/hdfs/数据的\位置/
dfs.name.dir
__路径\u到\u您希望\u存储\u您的\u数据/hdfs/name的位置/
这些更改后,您必须格式化您的名称节点:


hadoop namenode-format

但是hadoop在这之后不会启动。它始终显示namenode处于安全模式可能您还必须配置dfs.name目录:dfs.name.dir/Users/helmut/programmieren/hdfs/name/dfs.data.dir和dfs.name.dir应指向外部驱动器上的某个位置。更改这些值后,使用
hadoop namenode-format
重新格式化hdfs文件系统,执行
hadoop namenode-format
后,需要删除dfs.name.dir中的任何内容