Cluster computing 当使用K-Means聚类时,如果集群中只有一个数据点,该怎么办?

Cluster computing 当使用K-Means聚类时,如果集群中只有一个数据点,该怎么办?,cluster-computing,cluster-analysis,k-means,bisection,Cluster Computing,Cluster Analysis,K Means,Bisection,我正在使用二分法K-Means,它利用K=2的K-Means,我在一个集群中只遇到了一个数据点。这是否意味着K-Means过程应该停止,因为它已达到收敛状态,还是应该用新值重新启动算法过程?1元素簇在K-Means中非常频繁地出现在脏数据上 因为k-means最小化了平方误差,所以将离群点分配给它们自己的聚类会给出关于平方误差目标的“最佳”结果。所以这通常是正确的结果-这不是用户真正想要的。通常,用户会更喜欢非平方优化(例如,使用PAM)或具有不属于集群的“噪声”点概念的方法(例如,DBSCAN

我正在使用二分法K-Means,它利用K=2的K-Means,我在一个集群中只遇到了一个数据点。这是否意味着K-Means过程应该停止,因为它已达到收敛状态,还是应该用新值重新启动算法过程?

1元素簇在K-Means中非常频繁地出现在脏数据上


因为k-means最小化了平方误差,所以将离群点分配给它们自己的聚类会给出关于平方误差目标的“最佳”结果。所以这通常是正确的结果-这不是用户真正想要的。通常,用户会更喜欢非平方优化(例如,使用PAM)或具有不属于集群的“噪声”点概念的方法(例如,DBSCAN)。

请参见,让社区帮助您。这并不能真正回答问题。我应该如何处理结果?然后你可能需要更好地澄清你的问题。你不需要对结果做任何事情?