Parameters SSAS聚类算法的结果因输入相同而不同

Parameters SSAS聚类算法的结果因输入相同而不同,parameters,ssas,cluster-analysis,windows-clustering,Parameters,Ssas,Cluster Analysis,Windows Clustering,我对数据挖掘和统计还很陌生 我在VisualStudio中构建了一个数据挖掘模型。我正在使用Microsoft群集算法,我遇到了一些问题 我修改了一些默认参数,比如将最大输入参数设置为350,将集群方法设置为不可伸缩的期望最大化(我有80000行数据)。我还将集群计数设置为0,这样算法就会选择最好的一个 问题来了。我使用的是tempdb,每次我重启电脑时都会刷新它(我没有很多可用空间,所以tempdb在那个部门是个不错的选择)。无论如何,当我重新加载相同的数据并构建挖掘结构时,我得到了完全不同的

我对数据挖掘和统计还很陌生

我在VisualStudio中构建了一个数据挖掘模型。我正在使用Microsoft群集算法,我遇到了一些问题

我修改了一些默认参数,比如将最大输入参数设置为350,将集群方法设置为不可伸缩的期望最大化(我有80000行数据)。我还将集群计数设置为0,这样算法就会选择最好的一个

问题来了。我使用的是tempdb,每次我重启电脑时都会刷新它(我没有很多可用空间,所以tempdb在那个部门是个不错的选择)。无论如何,当我重新加载相同的数据并构建挖掘结构时,我得到了完全不同的结果。有一次我得到了10个集群,然后是13个集群,然后是9个集群。我还尝试将cluster count强制为13以复制相同的集群,但它们也不同(集群本身的分布和大小不同)

我的问题是为什么?他们不是决定性的。我了解大小和分布的微小变化,但每次刷新数据库时,我都会得到不同的结果。 算法不应该给我几乎相同的结果,而不是非常不同的结果吗。我做错什么了吗?

EM(高斯混合建模)与通常初始化的k-均值一样 随机的


所以不是,它不是确定性的,得到不同的结果是正常的。

但是结果的波动应该是小的,而不是大的?只有在数据非常干净并且确实是高斯的情况下。如果不合身,则可能不止一个不合身。