Java hadoop中的块池_Java_Hadoop_Hdfs_Yarn_Hadoop2

Java hadoop中的块池

java hadoop

Java hadoop中的块池,java,hadoop,hdfs,yarn,hadoop2,Java,Hadoop,Hdfs,Yarn,Hadoop2,我在阅读Hadoop教程时，对Hadoop中的块池产生了怀疑块池-基本上每个块池都是彼此独立管理的，每个块池都是属于单个命名空间的一组块。块池是虚拟概念还是类似于内存中维护的块上的metadat 它是关于每个数据块的元数据 hadoop中的文件被划分为块，然后这些块存储在不同的数据节点上。但要再次访问这些数据，我们需要知道这些数据块存储在哪里。namenode在块池的帮助下完成这项工作因此，块池是hadoop集群上每个文件的每个块的元数据。它们存储在namenode的内存中，而不是磁盘上。

我在阅读Hadoop教程时，对Hadoop中的块池产生了怀疑

块池-基本上每个块池都是彼此独立管理的，每个块池都是属于单个命名空间的一组块。

块池是虚拟概念还是类似于内存中维护的块上的metadat

它是关于每个数据块的元数据
hadoop中的文件被划分为块，然后这些块存储在不同的数据节点上。但要再次访问这些数据，我们需要知道这些数据块存储在哪里。namenode在块池的帮助下完成这项工作
因此，块池是hadoop集群上每个文件的每个块的元数据。它们存储在namenode的内存中，而不是磁盘上。因此，如果namenode关闭，则需要重建此信息
现在在Hadoop Federation中，我们有了多个名称空间的概念。不同的名称节点负责不同的名称空间。假设我们有两台机器作为名称节点，如下所示：

First namenode（NN1）处理命名空间/财务下的所有文件，即财务部门的所有数据

类似地，第二个namenode（NN2）处理命名空间/accounts下的accounts department数据

现在，要管理/finance名称空间下的文件块，只需要NN1。因此，只有NN1需要具有/finance命名空间的区块池。类似地，要了解/accounts下的文件，我们只需要NN2。只有NN2将具有/accounts命名空间的块池。因此，它们独立运行。
每个数据块的元数据是
hadoop中的文件被划分为块，然后这些块存储在不同的数据节点上。但要再次访问这些数据，我们需要知道这些数据块存储在哪里。namenode在块池的帮助下完成这项工作
因此，块池是hadoop集群上每个文件的每个块的元数据。它们存储在namenode的内存中，而不是磁盘上。因此，如果namenode关闭，则需要重建此信息
现在在Hadoop Federation中，我们有了多个名称空间的概念。不同的名称节点负责不同的名称空间。假设我们有两台机器作为名称节点，如下所示：

First namenode（NN1）处理命名空间/财务下的所有文件，即财务部门的所有数据

类似地，第二个namenode（NN2）处理命名空间/accounts下的accounts department数据

现在，要管理/finance名称空间下的文件块，只需要NN1。因此，只有NN1需要具有/finance命名空间的区块池。类似地，要了解/accounts下的文件，我们只需要NN2。只有NN2将具有/accounts命名空间的块池。因此，它们独立运行。
块池拥有关于Hadoop集群中每个块和每个文件数据的信息。块池将每个块的元数据存储在内存中，以便更快地访问，而不是存储在磁盘上。众所周知，Hadoop将每个文件划分为块序列，并将它们存储在不同的数据节点上。每个块都有一定的大小，即在Hadoop 1中，块大小为64 MB，在Hadoop 2中，我们使用块大小为128 MB。如果namenode关闭或操作失败，则hadoop集群中的用户或管理员将无法获得全部信息
在Hadoop中块池在哪里开始使用
Hadoop联合使用多个名称空间的概念。名称空间由不同的名称节点维护
考虑在管理、开发和其他领域的组织中维护数据的场景。因此，我们有一个或多个namenodes来监视用户所做的操作
在本例中，hadoop集群中有两个NameNode
First Namenode表示NN1处理/Administration命名空间下的所有文件，即管理帐户的所有数据
类似地，第二个Namenode表示NN2处理/Development下开发帐户的所有数据
因此，为了查看administration帐户下所有文件的块，只需要NN1来查看/administration命名空间的块池。要查看/开发中的文件，我们只需要NN2。所以这两个块池是相互独立的。因此，他们独立地作出反应

我希望所有阅读该问题的人都能清楚地理解这些概念。
块池拥有Hadoop集群中每个块和每个文件数据的信息。块池将每个块的元数据存储在内存中，以便更快地访问，而不是存储在磁盘上。众所周知，Hadoop将每个文件划分为块序列，并将它们存储在不同的数据节点上。每个块都有一定的大小，即在Hadoop 1中，块大小为64 MB，在Hadoop 2中，我们使用块大小为128 MB。如果namenode关闭或操作失败，则hadoop集群中的用户或管理员将无法获得全部信息
在Hadoop中块池在哪里开始使用
Hadoop联合使用多个名称空间的概念。名称空间由不同的名称节点维护
考虑在管理、开发和其他领域的组织中维护数据的场景。因此，我们有一个或多个namenodes来监视用户所做的操作
在本例中，hadoop集群中有两个NameNode
First Namenode表示NN1处理/Administration命名空间下的所有文件，即管理帐户的所有数据
类似地，第二个Namenode表示NN2处理/Development下开发帐户的所有数据
因此，为了查看administration帐户下所有文件的块，只需要NN1来查看/administration命名空间的块池。要查看/开发中的文件，我们只需要NN2。所以这两个街区的游泳池