是否在Hadoop集群的所有节点上复制配置单元表

是否在Hadoop集群的所有节点上复制配置单元表,hadoop,hive,hiveql,Hadoop,Hive,Hiveql,创建配置单元表时,是否在Hadoop集群的所有节点上创建该表?当我将数据加载到表中时,数据是否会跨所有这些节点进行复制 我猜是的?Hive只是hdfs之上的一个元数据层。因此,要回答您的问题,您只需考虑复制在hdfs中是如何工作的 您关于每个节点上的问题并不是hdfs复制工作原理的正确心智模型。hdfs复制对配置单元表一无所知。它只知道数据块 配置单元表的每个数据块都有K个副本,其中K是为给定配置单元表配置的复制因子。数据块与特定节点的关联由hdfs的本地/机架/群集位置策略驱动 当我创建配置单

创建配置单元表时,是否在Hadoop集群的所有节点上创建该表?当我将数据加载到表中时,数据是否会跨所有这些节点进行复制


我猜是的?

Hive只是hdfs之上的一个元数据层。因此,要回答您的问题,您只需考虑复制在hdfs中是如何工作的

您关于每个节点上的问题并不是hdfs复制工作原理的正确心智模型。hdfs复制对配置单元表一无所知。它只知道数据块

配置单元表的每个数据块都有K个副本,其中K是为给定配置单元表配置的复制因子。数据块与特定节点的关联由hdfs的本地/机架/群集位置策略驱动

当我创建配置单元表时,是否在配置单元的所有节点上创建该表 Hadoop集群

没有。 Hadoop数据节点不是彼此的镜像。这些只是数据存储单元,其存储和元数据由NameNode管理

您的配置单元表将根据复制因子集进行复制。如果复制因子为1,则只有一个副本

当我将数据加载到表中时,数据是否被复制 跨越所有这些节点

没有。 正如我前面指定的,hadoop数据节点不是彼此的镜像,因此它们都不包含所有数据。它们只包含集群中基于复制因子集定义的数据拷贝数

您加载的数据将根据NameNode决定的节点上的复制系数进行复制。

由于配置单元使用HDFS作为存储,因此数据的复制由NameNode负责……我认为配置单元表数据的复制不会单独负责。。