Algorithm 如何将大小偏好添加到聚类评估中?

Algorithm 如何将大小偏好添加到聚类评估中?,algorithm,machine-learning,cluster-analysis,evaluation,Algorithm,Machine Learning,Cluster Analysis,Evaluation,我正在尝试对一些数据应用k-means或其他聚类算法。我希望剪影评分的聚类结果变得好,同时,我更喜欢较少的聚类数量。因此,我想知道如何使用轮廓分数或其他指标联合评估集群的数量 例如,聚类模型得到以下结果: 尺寸=2:分数=0.534 尺寸=7:分数=0.617 尺寸=20:分数=0.689 我认为与其他模型相比,聚类大小为7的模型是最好的。虽然最后一个模型的得分是最好的,但是集群的数量太多了。我试着用集群大小来划分剪影分数,但这似乎太微不足道了。别胡闹。把它做好 这意味着从数学上定义你个人认为什

我正在尝试对一些数据应用k-means或其他聚类算法。我希望剪影评分的聚类结果变得好,同时,我更喜欢较少的聚类数量。因此,我想知道如何使用轮廓分数或其他指标联合评估集群的数量

例如,聚类模型得到以下结果:

尺寸=2:分数=0.534

尺寸=7:分数=0.617

尺寸=20:分数=0.689

我认为与其他模型相比,聚类大小为7的模型是最好的。虽然最后一个模型的得分是最好的,但是集群的数量太多了。我试着用集群大小来划分剪影分数,但这似乎太微不足道了。

别胡闹。把它做好

这意味着从数学上定义你个人认为什么是好的,当然也解释了为什么提出的方程能够很好地捕捉到这一点。然后使用这种评估方法,但要准备好,其他人可能会不同意你的观点,因为许多集群都是不好的


对。轮廓除以簇的数量不是一个好主意。特别是,它在理论上不是一个很有根据的模型,是吗?

欢迎来到stackoverflow,这不是一个程序问题,它更像是一个史诗般的决定,如何讨论kmeans是否符合您的想法,我投票结束这个问题,对不起