Hive Druid数据源存储大小大于配置单元orc大小
我是德鲁伊新手。我们正在使用德鲁伊蜂巢集成。从蜂巢加载数据 探索德鲁伊数据源和蜂巢兽人之间的大小 创建的druid数据源: 创建由'org.apache.hadoop.hive.druid.DruidStorageHandler'存储的外部表druid\u表,从druid\u源代码测试中选择Hive Druid数据源存储大小大于配置单元orc大小,hive,druid,Hive,Druid,我是德鲁伊新手。我们正在使用德鲁伊蜂巢集成。从蜂巢加载数据 探索德鲁伊数据源和蜂巢兽人之间的大小 创建的druid数据源: 创建由'org.apache.hadoop.hive.druid.DruidStorageHandler'存储的外部表druid\u表,从druid\u源代码测试中选择tme作为\u时间,dm1,dm2 已创建配置单元外部表: 从druid源代码测试中创建存储为ORC的外部表hive\U表,选择tmeAS\uU时间,dm1,dm2 两个表中的数据集相同。Hive orc表大
tme
作为\u时间,dm1
,dm2
已创建配置单元外部表:
从druid源代码测试中创建存储为ORC的外部表hive\U表,选择tme
AS\uU时间
,dm1
,dm2
两个表中的数据集相同。Hive orc表大小为25MB,而Druid数据源占用约60MB的存储空间
Druid索引zip文件包含以下文件。为什么德鲁伊的体型比蜂巢兽人大?德鲁伊的压迫发生在我身上?我是否缺少一些用于完成压缩的配置?请专家们澄清
version.bin
factory.json
斯摩什
梅塔·斯摩什