Ssas 如果模型的细节事先未知,是否可以构建OLAP多维数据集?

Ssas 如果模型的细节事先未知,是否可以构建OLAP多维数据集?,ssas,olap,cube,cubes,Ssas,Olap,Cube,Cubes,请原谅我提出了一个模糊的问题——我对OLAP&cubes不是很熟悉。让我解释一下我的情况 我想建立一个数据库来存储问卷结果,每个问卷可能有几十个问题。收集了几千份完整的调查问卷后,我想对结果进行分析,这听起来像是OLAP类型(我对OLAP知之甚少)的一个很好的候选者。我需要能够对“所有20-30岁拥有狗的男性受访者”进行查询,即结合“你多大了”、“你有狗吗”等答案 我还希望能够存储下个月和下个月的调查结果,等等,并运行查询,显示本月与上个月的比较,等等。我想,到目前为止,一切都很好 以下是我问题

请原谅我提出了一个模糊的问题——我对OLAP&cubes不是很熟悉。让我解释一下我的情况

我想建立一个数据库来存储问卷结果,每个问卷可能有几十个问题。收集了几千份完整的调查问卷后,我想对结果进行分析,这听起来像是OLAP类型(我对OLAP知之甚少)的一个很好的候选者。我需要能够对“所有20-30岁拥有狗的男性受访者”进行查询,即结合“你多大了”、“你有狗吗”等答案

我还希望能够存储下个月和下个月的调查结果,等等,并运行查询,显示本月与上个月的比较,等等。我想,到目前为止,一切都很好

以下是我问题的要点:本月我的调查问卷可能会有关于性别、年龄和养狗的问题,下个月的调查问卷可能会包括一个关于(比如)眼睛颜色的问题。它可能(也可能不)会提出一些问题。这在OLAP世界中是可行的,还是在设计多维数据集时需要提前知道所有的“维度”(如果我使用了正确的术语)

此外,如果我正在运行多个不同的调查,其中包含不同但重叠的问题,我可以将它们全部存储在同一个多维数据集中,并跨调查运行查询吗?每个调查可能有几十个问题,其中几十个问题与其他调查重叠。OLAP系统能满足这类需求吗?我只是不知道它们有多僵硬,也不知道它们是否适合这种用法

非常感谢您的帮助


另外,在有人提出建议之前,我确实购买了Kimball的数据仓库工具包,但还没有机会阅读它。(我怀疑它可能不会直接回答这个问题。)

首先我要说我也是OLAP新手,但我想我已经掌握了你想要实现的目标

实际上,您的问题是您的维度之一,该问题的答案是事实表的一部分,即事实表有答案,并且与年龄、性别、地点(可能)、问题相关的维度。这可能感觉有点背对背,但这是我在OLAP中要接受的东西

您可能还需要另一个与问题相关的维度,将它们分组到问卷中,但这可能只是问题维度本身的一个值,即问题{QuestionnaireID=1,QuestionNumber=4,QuestionText=“您有狗吗?”}


不确定这是否有帮助,但如果没有其他帮助,希望能给你一些想法。

这里还有另一位OLAP新手

1) 我只有使用Mondrian(Pentaho)创建OLAP多维数据集的经验,它确实允许您修改多维数据集的模式(这只是一个XML文件),并重新构建它们(或者用Pentaho的话说,发布)。所以对于这个平台,无论如何,没有提前知道所有维度的要求


2) 我同意拉祖罗斯关于创造问题维度的建议。这并不是要求你的每一个“事实”都有一个在所有维度上都存在的值,所以如果你要在维度上寻找“问题n”,那么我认为它应该只给你“问题n”的问卷的数据是一个相关维度。

有一份白皮书,其中有一节介绍了建模调查数据。这可能就是您要找的东西。

谢谢。我没有提到我希望我的用户能够控制他们的调查问卷,所以理想情况下他们会使用(web)UI来添加问题——这一“重新发布多维数据集”步骤听起来有点笨拙;很高兴知道我需要为此担心。遗憾的是,不能保证一个问题在所有问卷中都有相同的问题编号,但我想我真正需要的是一些可以用来将相关问题联系在一起的ID。到目前为止,没有人说问题的数量(每个问题可能有几十个可能的答案)是个问题。这是令人鼓舞的。如果您对关系建模有任何经验,请先尝试创建数据的关系模型。在那之后(并且在读了金博尔的书之后),你将对如何将关系设计转化为尺寸设计有更好的想法。对于问题,我将以[QuestionnaireID、QuestionnaireText、QuestionID、QuestionText、AnswerID、AnswerText]的形式创建一个包含所有问题和答案的维度。将用户的答案放入事实表中,您将能够按问卷、问题和答案对所有用户的答案进行切片。谢谢您的回答。不过,我不能百分之百肯定我会遵守。你是说“问题”是一个维度,还是多个维度?(我可能有几十个问题,我在某个地方读到,在一个立方体中有超过12个维度不是一个好计划)。也许你的意思是,一些问题被表示为维度(即我需要切割数据的维度),但是其他问题会发生什么呢?问题的单一维度听起来也令人担忧,因为不同问题的答案可能差异很大——有些可能是数字答案,有些是多选答案,有些是日期……url更改:第112页+Mltidimensional模型从第24页开始,第112页是表格模型。