Parameters SSAS聚类算法的结果因输入相同而不同_Parameters_Ssas_Cluster Analysis_Windows Clustering

Parameters SSAS聚类算法的结果因输入相同而不同

parameters ssas

Parameters SSAS聚类算法的结果因输入相同而不同,parameters,ssas,cluster-analysis,windows-clustering,Parameters,Ssas,Cluster Analysis,Windows Clustering,我对数据挖掘和统计还很陌生我在VisualStudio中构建了一个数据挖掘模型。我正在使用Microsoft群集算法，我遇到了一些问题我修改了一些默认参数，比如将最大输入参数设置为350，将集群方法设置为不可伸缩的期望最大化（我有80000行数据）。我还将集群计数设置为0，这样算法就会选择最好的一个问题来了。我使用的是tempdb，每次我重启电脑时都会刷新它（我没有很多可用空间，所以tempdb在那个部门是个不错的选择）。无论如何，当我重新加载相同的数据并构建挖掘结构时，我得到了完全不同的

我对数据挖掘和统计还很陌生

我在VisualStudio中构建了一个数据挖掘模型。我正在使用Microsoft群集算法，我遇到了一些问题

我修改了一些默认参数，比如将最大输入参数设置为350，将集群方法设置为不可伸缩的期望最大化（我有80000行数据）。我还将集群计数设置为0，这样算法就会选择最好的一个

问题来了。我使用的是tempdb，每次我重启电脑时都会刷新它（我没有很多可用空间，所以tempdb在那个部门是个不错的选择）。无论如何，当我重新加载相同的数据并构建挖掘结构时，我得到了完全不同的结果。有一次我得到了10个集群，然后是13个集群，然后是9个集群。我还尝试将cluster count强制为13以复制相同的集群，但它们也不同（集群本身的分布和大小不同）

我的问题是为什么？他们不是决定性的。我了解大小和分布的微小变化，但每次刷新数据库时，我都会得到不同的结果。算法不应该给我几乎相同的结果，而不是非常不同的结果吗。我做错什么了吗？

EM（高斯混合建模）与通常初始化的k-均值一样随机的

所以不是，它不是确定性的，得到不同的结果是正常的。

但是结果的波动应该是小的，而不是大的？只有在数据非常干净并且确实是高斯的情况下。如果不合身，则可能不止一个不合身。