Oracle 配置单元查询语言中的主键和索引是否可用?

Oracle 配置单元查询语言中的主键和索引是否可用?,oracle,indexing,hive,hiveql,hive-query,Oracle,Indexing,Hive,Hiveql,Hive Query,我们正在尝试将oracle表迁移到配置单元并处理它们。 目前oracle中的表具有主键、外键和唯一键约束 我们能在蜂箱里复制同样的吗 我们正在分析如何实现它。Hive是在Hive 0.7.0()中引入的,在Hive 3.0()中删除的。请阅读本Jira中的评论。该功能在蜂箱中完全无用。RIP说,这些指数对于大数据来说太贵了 从Hive 2.1.0()起,Hive包括对未经验证的主键和外键约束的支持。这些约束未经验证,上游系统在加载到配置单元之前需要确保数据完整性。这些约束对于生成ER图和查询的工

我们正在尝试将oracle表迁移到配置单元并处理它们。 目前oracle中的表具有
主键
外键
唯一键
约束

我们能在蜂箱里复制同样的吗

我们正在分析如何实现它。

Hive是在Hive 0.7.0()中引入的,在Hive 3.0()中删除的。请阅读本Jira中的评论。该功能在蜂箱中完全无用。RIP说,这些指数对于大数据来说太贵了

从Hive 2.1.0()起,Hive包括对未经验证的主键和外键约束的支持。这些约束未经验证,上游系统在加载到配置单元之前需要确保数据完整性。这些约束对于生成ER图和查询的工具非常有用。此外,此类未经验证的约束也很有用,如自我记录。如果表有这样的约束,您可以很容易地找到什么应该是PK

在Oracle database Unique中,PK和FK约束由索引支持,因此它们可以快速工作,非常有用。但这不是蜂箱的工作原理,也不是它的设计目的

非常正常的情况是,在HDFS中加载包含半结构化数据的非常大的文件。在其上建立索引成本太高,如果没有索引来检查PK冲突,则只能扫描所有数据。通常,您不能在BigData中强制执行约束。上游进程可以考虑数据的完整性和一致性,但这并不能保证最终不会在从不同来源加载的某些大表中的配置单元中出现PK冲突

一些文件存储格式(如)具有内部轻量级“索引”,以加快筛选和启用谓词下推(PPD),使用此类索引不会实现PK和FK约束。这是无法做到的,因为通常情况下,您可以在配置单元中拥有许多属于同一个表的此类文件,而这些文件甚至可以具有不同的模式。为PB创建配置单元,您可以在一次运行中处理PB,数据可以是半结构化的,文件可以有不同的模式。Hadoop不支持随机写入,如果要重建索引,这会增加更多的复杂性和成本

如果这个“蜂巢”产品没有文档记录且不受支持,我会质疑将生产系统迁移到它是否明智。