使用SSAS为聚类安排维度

使用SSAS为聚类安排维度,ssas,data-mining,olap,cube,bids,Ssas,Data Mining,Olap,Cube,Bids,我在SSAS和数据挖掘方面遇到了一些问题,特别是Microsoft群集软件包 我打算最终在AMO和MDX中完成我的工作,但现在,我很高兴通过VisualStudio了解它在投标中是如何工作的。一步一个脚印 整个问题围绕着从垂直组织的表中“垂直”和“水平”(分别)进行集群。我的OLTP数据库中的主源数据表看起来像=> ID_NUM {数字1-20000} 特克乌德 {编号1-500,{每个ID_NUM}} (尽管只是为了处理屏幕上的数据而抓取了一些) TECK_值 {双精度,'事实'位} 所以-1

我在SSAS和数据挖掘方面遇到了一些问题,特别是Microsoft群集软件包

我打算最终在AMO和MDX中完成我的工作,但现在,我很高兴通过VisualStudio了解它在投标中是如何工作的。一步一个脚印

整个问题围绕着从垂直组织的表中“垂直”和“水平”(分别)进行集群。我的OLTP数据库中的主源数据表看起来像=>

ID_NUM {数字1-20000}

特克乌德 {编号1-500,{每个ID_NUM}} (尽管只是为了处理屏幕上的数据而抓取了一些)

TECK_值 {双精度,'事实'位}

所以-1000万行,两个整数和一个双精度

看起来是这样的-

因此,我在Visual Studio中创建了一个新的Analysis Services项目,设置了一个数据源,并将上面的表以及两个“维度表”(id_num的标识,每个teck_id的名称)引入到数据源视图中,并将其链接起来,匹配适当的键

看起来是这样的-

接下来,我想处理数据的表示方式,所以我要从这个数据源视图中设置一个多维数据集。我基于我的两个“dimension”表(上面的“id_num”主键一和“teck_id”主键一)创建维度,并从我的主表创建teck_值列的单个度量值(作为总和)。这一切似乎都编译成功了

看起来是这样的-

我认为一切都很顺利的原因是我可以通过浏览多维数据集来安排数据。我可以将我的“行”定义为id_num或“teck_id”,另一行填充列。度量值“Teck_值”始终构成表的数据集。这正是我想要的,可以灵活地双向排列数据

看起来是这样的- 而这—

漂亮!现在我想在此基础上做一些挖掘! 很简单,我希望使用Microsoft群集(单独)来-

  • 根据每个TECK_编号的不同,为每个TECK_编号分配一个群集编号
  • 根据每个ID的不同,为每个ID分配一个集群
这似乎是一个简单的要求——只需更改表示为“行”的内容和表示为“列”的内容——我似乎已经能够通过多维数据集浏览器实现这一点。从我未受过教育的角度来看,这似乎是OLAP而不是OLTP的要点之一

然而,当我试图建立这一点,我完全失败了

聚类向导让我感到困惑,我得出了毫无意义的结果。我可以选择一个键(我可以选择上面的任何一个键),但没有选择通过另一个维度进行解析。事实上,我唯一可以选择挖掘的是TECK_值,这一点都不好,因为它不会将不同的字段分开

我的向导看起来像这样-

所以,我陷入了困境。我真的不想回去水平排列我的OLTP数据库,因为1)这意味着当我尝试对我的TECK_ID进行分类时,会有20k列。2)我希望SSAS和OLAP能给我所需的灵活性来挖掘我想要的字段——这难道不是你建立多维数据集“随心所欲地分割数据”的部分原因吗

帮助我处理AMO/MDX方面的额外积分!:)