Hive 关于配置单元表存储

Hive 关于配置单元表存储,hive,Hive,谁能帮我理解下面这一点 我创建了一个不是分区表的配置单元表,但我在一个10节点集群中工作,所以在这种情况下,该表的数据是否会分布在不同的数据节点上???或者它只在一个节点中存在 如果它分布在不同的数据节点上,那么我们如何在\hive\warehouse文件夹下只看到一个文件 另外,请给出如何为分区表分配此存储的一些想法。表的数据和表的元数据是不同的 该表的数据(基本上只是HDFS中的一个文件)将根据基于您的配置的HDFS规则进行存储,一个文件将被拆分为n个块,并分布存储在数据节点上。 在您的情况

谁能帮我理解下面这一点

我创建了一个不是分区表的配置单元表,但我在一个10节点集群中工作,所以在这种情况下,该表的数据是否会分布在不同的数据节点上???或者它只在一个节点中存在

如果它分布在不同的数据节点上,那么我们如何在\hive\warehouse文件夹下只看到一个文件

另外,请给出如何为分区表分配此存储的一些想法。

表的数据和表的元数据是不同的

该表的数据(基本上只是HDFS中的一个文件)将根据基于您的配置的HDFS规则进行存储,一个文件将被拆分为n个块,并分布存储在数据节点上。 在您的情况下,一个配置单元表、一个文件或一组文件的数据将分布存储在集群中的所有10个节点中。 此外,此分布在块级别完成,在用户级别不可见。 您可以在Web UI中轻松检查为文件创建的块数

分区表就像在HDFS中的表目录中添加另一个目录一样。所以它遵循同样的规则。

看那里