Hadoop 有人能澄清这一点吗&引用;块池存储未分区…“;

Hadoop 有人能澄清这一点吗&引用;块池存储未分区…“;,hadoop,Hadoop,我在读Hadoop——汤姆·怀特的权威指南,第四版,他在那里写道 但是,块池存储未分区,因此数据节点注册 使用群集中的每个namenode并存储来自多个块的块 游泳池。” 有人能澄清一下吗?具体来说,如果 NameNodeA: blockpool for DataNode1 and DataNode2 NameNodeB: blockpool for DataNode3 and DataNode4 …NameNodeB是否存储NodeNameA的区块池?这似乎是浪费,因为作者之前写道“名称节点

我在读Hadoop——汤姆·怀特的权威指南,第四版,他在那里写道

但是,块池存储未分区,因此数据节点注册 使用群集中的每个namenode并存储来自多个块的块 游泳池。”

有人能澄清一下吗?具体来说,如果

NameNodeA: blockpool for DataNode1 and DataNode2
NameNodeB: blockpool for DataNode3 and DataNode4
…NameNodeB是否存储NodeNameA的区块池?这似乎是浪费,因为作者之前写道“名称节点彼此不通信”


更新:在查看此处的注释并重新阅读之后,它似乎是这样工作的:您可以将名称空间划分为联邦名称节点,这些节点管理一个分区(例如,/user),但包含整个名称空间(例如,/user/foo/bar)。

更详细地解释了该体系结构。它是由雅虎的Hadoop提交者之一创建的。我误以为只有一个名称空间,但事实上,您可以有多个名称空间。

更详细地解释了体系结构。它是由雅虎的Hadoop提交者之一创建的。我错误地认为只有一个名称空间,但事实上,您可以有多个名称空间。

如果我错了,请纠正我,但HDFS Federation就是这样工作的,不是吗?所有datanodes都连接到一个名为blockpool的命名空间,所有namenodes都可以访问该命名空间。因此名称节点不必相互连接,它们只需要访问池,所有名称节点都将具有FS的元数据。如果我错了,请纠正我,但HDFS联合就是这样工作的,不是吗?所有datanodes都连接到一个名为blockpool的命名空间,所有namenodes都可以访问该命名空间。因此名称节点不必相互连接,它们只需要访问池,所有名称节点都将具有FS的元数据。