Etl 数据仓库共享层中的代理密钥有什么好处?

Etl 数据仓库共享层中的代理密钥有什么好处?,etl,data-warehouse,Etl,Data Warehouse,OLTP源表具有代理键(数字值)和自然键(字母数字值),那么我可以跳过在目标OLAP DB(维度模型)中为维度表创建代理键。 我知道我将需要事实表的代理键,因为事实表的唯一键将是一个大的集合,我将需要一个带有数字值的单列作为主键。 我正在连接多个源表以将数据填充到一维目标中,然后我想使用驱动表的唯一id(数值)(此id从OLTP源继承)作为主键,前提是结果记录的数据粒度为驱动表的id级别(结果记录是主源驱动表与其他源表联接后的记录) 数据仓库层中的代理密钥有什么好处 谢谢, 拉杰尼什在库希克·罗

OLTP源表具有代理键(数字值)和自然键(字母数字值),那么我可以跳过在目标OLAP DB(维度模型)中为维度表创建代理键。 我知道我将需要事实表的代理键,因为事实表的唯一键将是一个大的集合,我将需要一个带有数字值的单列作为主键。 我正在连接多个源表以将数据填充到一维目标中,然后我想使用驱动表的唯一id(数值)(此id从OLTP源继承)作为主键,前提是结果记录的数据粒度为驱动表的id级别(结果记录是主源驱动表与其他源表联接后的记录)

数据仓库层中的代理密钥有什么好处

谢谢,
拉杰尼什

在库希克·罗伊回答这个问题时结束了循环。 添加其他参考资料,希望对社区有所帮助:


基本上,代理键是一种人工键,用于替代数据仓库表中定义的自然键(NK)。我们可以使用自然键或业务键作为表的主键

这些是代理密钥的一些好处

  • 代理密钥有助于保护数据仓库系统免受意外影响
    行政变更
  • 代理键允许数据仓库系统集成相同的数据

  • 代理项键使您能够将行添加到不需要的维度 存在于源系统中

  • 代理键提供了跟踪维度更改的方法 随时间变化的属性
  • 整数代理键可以提高查询和处理性能 与较大的字符或GUID键相比

  • 请参考维基百科关于代理密钥的优点-我认为现在代理密钥的概念被智能密钥取代了。它更好,更接近你的想法。它类似于ETL生成的数值,它来自源代码+源代码系统的唯一值,以使它们唯一。