Data warehouse 数据仓库中的低基数维

Data warehouse 数据仓库中的低基数维,data-warehouse,dimensional-modeling,Data Warehouse,Dimensional Modeling,事实数据表中有很多列的基数很低(~8)。这些列中的每一列都存储引用主表的键。我想知道是将每个主表作为维度导入,还是将值直接存储在事实表中。主表除了我试图存储的值之外没有其他属性。每种方法的优缺点是什么 这似乎是一个典型的垃圾维度的例子,它将大量杂项、低基数的变量和指标组合在一起(而不是将它们放在单独的维度表中) 其他方法的缺点: 将每个低基数属性放在一个单独的专用维度中可能会导致模型过于复杂,维度表的数量过多() 允许将属性直接存储在事实表中,但仅为订单号或发票号、零售点交易号等值保留,即没有

事实数据表中有很多列的基数很低(~8)。这些列中的每一列都存储引用主表的键。我想知道是将每个主表作为维度导入,还是将值直接存储在事实表中。主表除了我试图存储的值之外没有其他属性。每种方法的优缺点是什么

这似乎是一个典型的垃圾维度的例子,它将大量杂项、低基数的变量和指标组合在一起(而不是将它们放在单独的维度表中)

其他方法的缺点:

  • 将每个低基数属性放在一个单独的专用维度中可能会导致模型过于复杂,维度表的数量过多()
  • 允许将属性直接存储在事实表中,但仅为订单号或发票号、零售点交易号等值保留,即没有任何其他属性描述它们的高基数值。
    低基数标志不是DDs,因为即使它们现在可能由一个单独的键组成,将来也可能很容易具有其他属性,例如报告的多个描述性标题-移动用户的缩写,桌面用户的缩写

详细信息:

谢谢马瑞克。我用同样的想法实现了它。