Hive Druid数据源存储大小大于配置单元orc大小

Hive Druid数据源存储大小大于配置单元orc大小,hive,druid,Hive,Druid,我是德鲁伊新手。我们正在使用德鲁伊蜂巢集成。从蜂巢加载数据 探索德鲁伊数据源和蜂巢兽人之间的大小 创建的druid数据源: 创建由'org.apache.hadoop.hive.druid.DruidStorageHandler'存储的外部表druid\u表,从druid\u源代码测试中选择tme作为\u时间,dm1,dm2 已创建配置单元外部表: 从druid源代码测试中创建存储为ORC的外部表hive\U表,选择tmeAS\uU时间,dm1,dm2 两个表中的数据集相同。Hive orc表大

我是德鲁伊新手。我们正在使用德鲁伊蜂巢集成。从蜂巢加载数据

探索德鲁伊数据源和蜂巢兽人之间的大小

创建的druid数据源:

创建由'org.apache.hadoop.hive.druid.DruidStorageHandler'存储的外部表druid\u表,从druid\u源代码测试中选择
tme
作为
\u时间
dm1
dm2

已创建配置单元外部表:

从druid源代码测试中创建存储为ORC的外部表hive\U表,选择
tme
AS
\uU时间
dm1
dm2

两个表中的数据集相同。Hive orc表大小为25MB,而Druid数据源占用约60MB的存储空间

Druid索引zip文件包含以下文件。为什么德鲁伊的体型比蜂巢兽人大?德鲁伊的压迫发生在我身上?我是否缺少一些用于完成压缩的配置?请专家们澄清

version.bin

factory.json

斯摩什

梅塔·斯摩什