Sql 我应该雪花化(我不想,但认为我需要)还是应该用大量冗余信息创建第二维度?

Sql 我应该雪花化(我不想,但认为我需要)还是应该用大量冗余信息创建第二维度?,sql,data-warehouse,dimensional-modeling,snowflake-cloud-data-platform,Sql,Data Warehouse,Dimensional Modeling,Snowflake Cloud Data Platform,在RDMS中,模型如下所示: --------------------- --------------------- | ContractTable | | CoverageTable | --------------------- --------------------- | ContractID | --1:M ------| CoverageID | | C

在RDMS中,模型如下所示:

---------------------               ---------------------
| ContractTable     |               | CoverageTable     |
---------------------               ---------------------
| ContractID        |   --1:M ------| CoverageID        |
| CoverageID        |--/            | Coverage info...  |
| Contract info...  |               ---------------------
---------------------

我在做二维。dimContract和dimContractCoverage。dimContractCoverage中是否应该包含与dimContracts+与某个报道相关的信息相同的所有描述性列,或者我应该只是雪花?雪花是一个简单的答案,但我在寻找一些安慰。

你的事实是什么?雪花很少是正确的答案,但如果不了解你的模型,我们就不能肯定地告诉你。正如罗恩所问,关于你的事实的信息会很有帮助。就目前情况而言,我也不确定您为什么认为需要重复数据——对您的想法进行一些澄清可能会有所帮助。这是我们DW的开始,因此我希望创建适用于多个事实的一致维度。在本例中,事实是每个合同已索赔、应计或保留了多少美元的累积月度快照。我可以只使用一个合同维度,并在其中总结覆盖率数据(我认为)。至于为什么我认为我们需要重复数据:只有在具有2个维度的场景中,这才适用,但是如果我在接下来的过程中创建一个覆盖维度,那么覆盖dim中需要如此多的合同信息,我会这样做