Database design 数据仓库事实表的设计

Database design 数据仓库事实表的设计,database-design,data-warehouse,cube,Database Design,Data Warehouse,Cube,您将如何在数据仓库中对此进行建模: 有些市属地理区域,存在于地理等级中,如省(如州,如明尼苏达州)、地区(如中西部) 通过计算绩效指标,如完成住房积压百分比、支出预算百分比、分配给基础设施的预算百分比、债务人覆盖率等,对这些城市进行绩效评估 其中大约有100个绩效指标 这些指标分为“绩效组”,绩效组本身分为“关键绩效领域” 对绩效指标进行计算(计算根据某些因素(如市政类型、规模、地区等)以产生“绩效分数” 然后将权重应用于分数,以创建“最终加权分数”。(即,当汇总到“关键绩效领域”时,某些指标

您将如何在数据仓库中对此进行建模:


  • 有些市属地理区域,存在于地理等级中,如省(如州,如明尼苏达州)、地区(如中西部)

  • 通过计算绩效指标,如完成住房积压百分比、支出预算百分比、分配给基础设施的预算百分比、债务人覆盖率等,对这些城市进行绩效评估

  • 其中大约有100个绩效指标

  • 这些指标分为“绩效组”,绩效组本身分为“关键绩效领域”

  • 对绩效指标进行计算(计算根据某些因素(如市政类型、规模、地区等)以产生“绩效分数”

  • 然后将权重应用于分数,以创建“最终加权分数”。(即,当汇总到“关键绩效领域”时,某些指标的权重高于其他指标)

  • 将有一个时间维度(每年进行评估),但目前只有一个数据集


  • 注意:用户需要能够轻松地跨任何指标组合查询数据。i、 e.有人可能希望看到:(i)省级(v)的(ii)“债务人覆盖率”与(iii)“预算支出百分比”与(iv)“债务人天数”的绩效水平

    我尝试将“IndicatorType”作为一个维度,然后在该表中设置[indicator/performance group/performance area]层次结构,但我无法确定如何在同一行上轻松获取多个指标,因为它需要事实表别名(?)。所以我想把所有100个项目都列在一个(非常宽的!)事实表中,但这样我就失去了[group/area]对指标的继承权

    有什么想法吗


    谢谢

    这是一个非常复杂的问题,但我花了时间研究了你的一些观点,并提出了这个模型(对你来说应该是一个好的开始)

    尺寸:

    迪姆尤市:

    字段={市镇、国家、地区、州、省、市?、大小、分数}


    Hierarchy={COUNTRY这是一个非常复杂的问题,但我花了时间仔细研究了你的一些观点,并提出了这个模型(对你来说应该是一个好的开始)

    尺寸:

    迪姆尤市:

    字段={市镇、国家、地区、州、省、市?、大小、分数}


    层次结构={COUNTRY希望这是不言自明的


    希望这是不言自明的


    谢谢你的帖子。但是,我有点困惑:如果指标级别维度存在,那么事实表中就不需要多个度量列,因为它们是一样的。这实际上是关于拥有100宽列事实表的设计优势,而不是单个数字度量列和“度量类型”维度(在这种情况下,指示器尺寸).使用宽表,我可以轻松地将多个列并排拉出,但我失去了PI/PG/KPA层次结构。使用指标维度,我失去了报告的灵活性。或者有其他方法吗?更多:我想有3个事实表:-绩效指标-绩效分数-最终加权分数(计算在负载中完成,即评分规则和权重适用,而不是在d/w中)因此:如果我在“性能指标”中有100列事实表中,我有100个度量值。现在很容易报告15个不同的度量值。如果度量值在DIM中,那么我只有一个度量值对象,需要一个过滤器才能得到正确的度量值,别名才能得到多个度量值?当从excel报告时,这是不可能的?所以扩大并失去PI/PG/KPA继承权?我不是说要放置度量值在黑暗中,我不确定你所说的尺寸分数是什么意思(如果你指的是这个)。我一定是误解了你所说的指标。在指标维度中,我会存储描述和表示某个指标的字段,然后在事实中存储该值的实际度量值。感谢你的帖子。但是,我很困惑:如果指标级别维度存在,那么就不需要在事实表,因为它们是同一件事。它实际上是关于拥有100宽列事实表的设计优势,而不是单个数字度量列和“度量类型”维度(在本例中为指标维度).使用宽表,我可以轻松地将多个列并排拉出,但我失去了PI/PG/KPA层次结构。使用指标维度,我失去了报告的灵活性。或者有其他方法吗?更多:我想有3个事实表:-绩效指标-绩效分数-最终加权分数(计算在负载中完成,即评分规则和权重适用,而不是在d/w中)因此:如果我在“性能指标”中有100列事实表中,我有100个度量值。现在很容易报告15个不同的度量值。如果度量值在DIM中,那么我只有一个度量值对象,需要一个过滤器才能得到正确的度量值,别名才能得到多个度量值?当从excel报告时,这是不可能的?所以扩大并失去PI/PG/KPA继承权?我不是说要放置度量值在黑暗中,我不确定你所说的尺寸分数是什么意思(如果你指的是这个).我一定是误解了你所说的指标。在指标维度中,我会存储描述和表示某个指标的字段,然后在事实中存储该值的实际度量值。这看起来是正确的:通过将指标放入事实表中,并且只有一个通用指标值,你就有了一点关键-价值对方法。这对报告不是很有用,但它是一种处理指标随时间变化的必然性的实用方法。根据这些数据,您可以发布