Hive 为什么蜂巢表需要扣起来以支持ACID事务?

Hive 为什么蜂巢表需要扣起来以支持ACID事务?,hive,acid,Hive,Acid,我想知道为什么蜂巢表需要扣起来以支持ACID事务。这只是蜂巢的怪癖吗?还是背后有什么原因?以下是关于hive的压实机: 压缩程序运行后台MapReduce作业来压缩增量和 基本文件。压实有两种类型:主要压实和次要压实。这个 小压缩将许多小增量文件合并为一个大增量文件 文件主要的压缩成本更高,它需要增量文件和 将它们与基本文件合并。所有合并都是通过创建新的 文件并删除旧文件。有一个特殊的清洁过程来 这样做对每个铲斗分别进行压实。基地和 增量文件是按存储桶创建的。 详情如下: 因此,铲斗越多,压实速

我想知道为什么蜂巢表需要扣起来以支持ACID事务。这只是蜂巢的怪癖吗?还是背后有什么原因?

以下是关于hive的压实机:

压缩程序运行后台MapReduce作业来压缩增量和 基本文件。压实有两种类型:主要压实和次要压实。这个 小压缩将许多小增量文件合并为一个大增量文件 文件主要的压缩成本更高,它需要增量文件和 将它们与基本文件合并。所有合并都是通过创建新的 文件并删除旧文件。有一个特殊的清洁过程来 这样做对每个铲斗分别进行压实。基地和 增量文件是按存储桶创建的。

详情如下:


因此,铲斗越多,压实速度越快。

以下是关于hive压实机的一些信息:

压缩程序运行后台MapReduce作业来压缩增量和 基本文件。压实有两种类型:主要压实和次要压实。这个 小压缩将许多小增量文件合并为一个大增量文件 文件主要的压缩成本更高,它需要增量文件和 将它们与基本文件合并。所有合并都是通过创建新的 文件并删除旧文件。有一个特殊的清洁过程来 这样做对每个铲斗分别进行压实。基地和 增量文件是按存储桶创建的。

详情如下:

因此,铲斗越多,压实速度越快