E commerce 面向客户度量的数据模型设计

E commerce 面向客户度量的数据模型设计,e-commerce,analytics,data-modeling,data-warehouse,customer,E Commerce,Analytics,Data Modeling,Data Warehouse,Customer,如果我们想为客户设计一个包含所有指标的表,那么该表的设计应该是什么 更多详情: 假设有1000万客户。一个客户将有一行,指标可分为两种类型:1。哪些不改变:如出生日期、性别等。哪种变化:比如客户最后一次购买的日期等 问题:对此类数据建模的最佳方式是什么 如果有任何信息不清楚,请告诉我。免责声明:与大多数此类问题一样,“这取决于”您需要如何处理它、多维数据集是否最终显示数据、您的用户是谁、要求是什么等 如果你有这么多记录,Kimball会建议一个大表中的类型2不适合你,那么我可以为你指出Kimba

如果我们想为客户设计一个包含所有指标的表,那么该表的设计应该是什么

更多详情: 假设有1000万客户。一个客户将有一行,指标可分为两种类型:1。哪些不改变:如出生日期、性别等。哪种变化:比如客户最后一次购买的日期等

问题:对此类数据建模的最佳方式是什么


如果有任何信息不清楚,请告诉我。

免责声明:与大多数此类问题一样,“这取决于”您需要如何处理它、多维数据集是否最终显示数据、您的用户是谁、要求是什么等

如果你有这么多记录,Kimball会建议一个大表中的类型2不适合你,那么我可以为你指出Kimball文献中关于一个称为迷你尺寸(负责类型4和类型5 SCD)的东西的方向,这里也有描述:


我喜欢这些,特别是当您将“持久”键与主维度键一起保留在事实中时,以及当您将当前的小维度键保留在主维度中时。如果无法在垃圾维度中对小维度中的更改进行建模,则将更改信息保存在单独的表中可能仍然有价值。

是否关心更改字段中的旧值?示例:您的报告是否只显示当前的
上次购买日期
?我将变得迂腐(我知道这很烦人,但澄清术语可能有助于以后的讨论)<代码>出生日期,
年龄
等是属性。这些字段通常用于分组或过滤数据。在这种情况下,他们描述您的客户。度量(也称为度量)是通常求和/平均的字段<代码>销售价值,
售出的商品数量
等就是很好的例子。有关详细信息,请参见此。@目标数据-我们需要历史记录的一些属性。例如-
上次购买日期
我们需要保存历史记录,但有些属性不需要保存历史记录,如地址等。我可以推荐两个表吗?一个包含购买信息,并填写日期和客户id。另一个描述客户?每次进行新的购买时,customer表不需要新的条目。purchase表将包含历史记录(尽管您可以在customer表中包含当前的
上次购买日期
。@目的地数据-因此您是说我们应该有一个带有customer_id和固定属性的表(或者不需要保存历史记录的表-类型1)。还有另一个维度(迷你维度)——在这个维度中,我们每天每个客户id有一行,所有类型2指标?推理是:当类型1和常量列位于另一个表中时,您会最小化最小维度中的空间吗?这是正确的理解吗?本任务的目的是构建一个报告体系结构,我也这么认为-但是,报告体系结构中的具体设计选择应根据报告体系结构应满足的具体特征而有所不同。