Machine learning 即使用户具有非常不同的统计分布,如何对其进行分组?

Machine learning 即使用户具有非常不同的统计分布,如何对其进行分组?,machine-learning,statistics,cluster-analysis,Machine Learning,Statistics,Cluster Analysis,你能解释一下如何对用户进行分组,即使他们有非常不同的统计分布吗? 这似乎是一个无人监管的问题。我知道K-means通常用于聚类,但是当用户具有非常不同的统计分布时,K-means真的有效吗? 谢谢。K-means确实在所有聚类在其平均值周围具有相同的误差分布时效果最好,即,如果它们都遵循Nmu_j,eps 但至少有100种聚类算法。只需选择一个更适合您的数据。例如,DBS只能假设每个簇都是稠密的,簇之间由低密度的间隙隔开。它不能很好地聚类重叠的高斯分布,但它可以很好地处理不同分布的分离良好的聚类

你能解释一下如何对用户进行分组,即使他们有非常不同的统计分布吗? 这似乎是一个无人监管的问题。我知道K-means通常用于聚类,但是当用户具有非常不同的统计分布时,K-means真的有效吗?
谢谢。

K-means确实在所有聚类在其平均值周围具有相同的误差分布时效果最好,即,如果它们都遵循Nmu_j,eps


但至少有100种聚类算法。只需选择一个更适合您的数据。例如,DBS只能假设每个簇都是稠密的,簇之间由低密度的间隙隔开。它不能很好地聚类重叠的高斯分布,但它可以很好地处理不同分布的分离良好的聚类。

高斯混合模型。