u0X目录在Hadoop集群中的作用是什么?

u0X目录在Hadoop集群中的作用是什么?,hadoop,hdfs,Hadoop,Hdfs,我是Hadoop和Linux新手。我正在按照一个教程构建一个简单的3节点集群,在成功安装psedou分布式集群之后,我现在需要将其重新配置为完全分布式集群 我需要为fsimage文件提供冗余。因此,根据教程,我需要以以下方式编辑hdfs site.xml: 电流设置(伪分布式) dfs.namenode.name.dir 文件:/hadoop/hdfs/namenode 更改为(完全分发) dfs.namenode.name.dir file:///u01/dfs/namenode,fil

我是Hadoop和Linux新手。我正在按照一个教程构建一个简单的3节点集群,在成功安装psedou分布式集群之后,我现在需要将其重新配置为完全分布式集群

我需要为fsimage文件提供冗余。因此,根据教程,我需要以以下方式编辑
hdfs site.xml

电流设置(伪分布式)


dfs.namenode.name.dir
文件:/hadoop/hdfs/namenode
更改为(完全分发)


dfs.namenode.name.dir
file:///u01/dfs/namenode,file:///u02/dfs/namenode
这似乎很简单,但对于一个新的linux用户来说,它提出了一个疑问

u01
u02
的含义是什么?这些只是我需要创建的新目录吗?是否有任何与之关联的隐式配置?导师没有提供更多的信息,所以我猜我缺乏一些常识。我是否应该创建目录、修改xml文件并继续前进


任何关于什么是uXX目录以及它与Hadoop集群的关系的解释都将不胜感激。

属性
dfs.namenode.name.dir
决定了HDFS namenode必须在本地文件系统的何处存储持久的HDFS元数据(fsimage和编辑)。此属性的值至少需要一个目录路径

如果提供以逗号分隔的目录路径列表,namenode将尝试在所有这些路径上复制相同的元数据。这只是为了冗余

目录路径可以是任何结构,只要运行namenode进程的用户有权访问它们。这里的
uXX
纯粹是为了区分它们是不同的目录路径

除了本地FS之外,此属性还接受远程(如NFS)文件系统目录路径

<property>
   <name>dfs.namenode.name.dir</name>
   <value>file:/hadoop/hdfs/namenode</value>
</property>
<property>
  <name>dfs.namenode.name.dir</name>
  <value>file:///u01/dfs/namenode,file:///u02/dfs/namenode</value>
</property>