Cluster computing 当使用K-Means聚类时，如果集群中只有一个数据点，该怎么办？_Cluster Computing_Cluster Analysis_K Means_Bisection

Cluster computing 当使用K-Means聚类时，如果集群中只有一个数据点，该怎么办？

cluster-computing

Cluster computing 当使用K-Means聚类时，如果集群中只有一个数据点，该怎么办？,cluster-computing,cluster-analysis,k-means,bisection,Cluster Computing,Cluster Analysis,K Means,Bisection,我正在使用二分法K-Means，它利用K=2的K-Means，我在一个集群中只遇到了一个数据点。这是否意味着K-Means过程应该停止，因为它已达到收敛状态，还是应该用新值重新启动算法过程？1元素簇在K-Means中非常频繁地出现在脏数据上因为k-means最小化了平方误差，所以将离群点分配给它们自己的聚类会给出关于平方误差目标的“最佳”结果。所以这通常是正确的结果-这不是用户真正想要的。通常，用户会更喜欢非平方优化（例如，使用PAM）或具有不属于集群的“噪声”点概念的方法（例如，DBSCAN

我正在使用二分法K-Means，它利用K=2的K-Means，我在一个集群中只遇到了一个数据点。这是否意味着K-Means过程应该停止，因为它已达到收敛状态，还是应该用新值重新启动算法过程？

1元素簇在K-Means中非常频繁地出现在脏数据上

因为k-means最小化了平方误差，所以将离群点分配给它们自己的聚类会给出关于平方误差目标的“最佳”结果。所以这通常是正确的结果-这不是用户真正想要的。通常，用户会更喜欢非平方优化（例如，使用PAM）或具有不属于集群的“噪声”点概念的方法（例如，DBSCAN）。

请参见，让社区帮助您。这并不能真正回答问题。我应该如何处理结果？然后你可能需要更好地澄清你的问题。你不需要对结果做任何事情？