Machine learning 即使用户具有非常不同的统计分布，如何对其进行分组？_Machine Learning_Statistics_Cluster Analysis

Machine learning 即使用户具有非常不同的统计分布，如何对其进行分组？

machine-learning statistics

Machine learning 即使用户具有非常不同的统计分布，如何对其进行分组？,machine-learning,statistics,cluster-analysis,Machine Learning,Statistics,Cluster Analysis,你能解释一下如何对用户进行分组，即使他们有非常不同的统计分布吗？这似乎是一个无人监管的问题。我知道K-means通常用于聚类，但是当用户具有非常不同的统计分布时，K-means真的有效吗？谢谢。K-means确实在所有聚类在其平均值周围具有相同的误差分布时效果最好，即，如果它们都遵循Nmu_j，eps 但至少有100种聚类算法。只需选择一个更适合您的数据。例如，DBS只能假设每个簇都是稠密的，簇之间由低密度的间隙隔开。它不能很好地聚类重叠的高斯分布，但它可以很好地处理不同分布的分离良好的聚类

你能解释一下如何对用户进行分组，即使他们有非常不同的统计分布吗？这似乎是一个无人监管的问题。我知道K-means通常用于聚类，但是当用户具有非常不同的统计分布时，K-means真的有效吗？

谢谢。

K-means确实在所有聚类在其平均值周围具有相同的误差分布时效果最好，即，如果它们都遵循Nmu_j，eps

但至少有100种聚类算法。只需选择一个更适合您的数据。例如，DBS只能假设每个簇都是稠密的，簇之间由低密度的间隙隔开。它不能很好地聚类重叠的高斯分布，但它可以很好地处理不同分布的分离良好的聚类。

高斯混合模型。