Python 集群之后,我如何从顶级集群中选择最佳客户(子集)?

Python 集群之后,我如何从顶级集群中选择最佳客户(子集)?,python,cluster-analysis,unsupervised-learning,Python,Cluster Analysis,Unsupervised Learning,我使用K-Means(3个PCA维度和5个PCA维度)和GMM(5个PCA维度)方法,根据12个不同的特征进行聚类,以确定我的顶级客户。K-Means的两个输出产生了几乎相似的最佳客户集(每种情况下有1182个客户,重叠1156个),而GMM方法产生了660个客户作为我的顶级客户。这660名客户都参与了K-Means方法 现在我想确定我的顶级客户是谁。你能提出一些统计方法吗?我可以用这些方法来表示,X数量的客户确实是我的最佳客户群,并对他们进行一些A/B测试?我不想使用完整的识别集,因为为这么多

我使用K-Means(3个PCA维度和5个PCA维度)和GMM(5个PCA维度)方法,根据12个不同的特征进行聚类,以确定我的顶级客户。K-Means的两个输出产生了几乎相似的最佳客户集(每种情况下有1182个客户,重叠1156个),而GMM方法产生了660个客户作为我的顶级客户。这660名客户都参与了K-Means方法


现在我想确定我的顶级客户是谁。你能提出一些统计方法吗?我可以用这些方法来表示,X数量的客户确实是我的最佳客户群,并对他们进行一些A/B测试?我不想使用完整的识别集,因为为这么多的客户做计划可能会花费我更多。

尝试一些好的旧过滤!选择一个或多个功能,创建您自己的指标(可能顶级客户是购买最多的客户,或者是那些更忠诚/与公司关系更长久的客户,或者是这两个因素的加权和),对集群中的660个客户进行排序,并只选择前N个客户,N是您允许的最大客户数。

我不确定您在这里所说的“顶级”或“最佳”到底是什么意思,但是如果你想从集群中选出最具代表性的客户,你可以选择距离K-means的质心最近的客户,或者在GMM的相应高斯分布中概率密度最高的客户。@jdehesa:我同意这是上下文性质的。。。然而,我很想知道是否有任何统计方法可以更容易地筛选出最好的?