Python 集群之后，我如何从顶级集群中选择最佳客户（子集）？_Python_Cluster Analysis_Unsupervised Learning

Python 集群之后，我如何从顶级集群中选择最佳客户（子集）？

python

Python 集群之后，我如何从顶级集群中选择最佳客户（子集）？,python,cluster-analysis,unsupervised-learning,Python,Cluster Analysis,Unsupervised Learning,我使用K-Means（3个PCA维度和5个PCA维度）和GMM（5个PCA维度）方法，根据12个不同的特征进行聚类，以确定我的顶级客户。K-Means的两个输出产生了几乎相似的最佳客户集（每种情况下有1182个客户，重叠1156个），而GMM方法产生了660个客户作为我的顶级客户。这660名客户都参与了K-Means方法现在我想确定我的顶级客户是谁。你能提出一些统计方法吗？我可以用这些方法来表示，X数量的客户确实是我的最佳客户群，并对他们进行一些A/B测试？我不想使用完整的识别集，因为为这么多

我使用K-Means（3个PCA维度和5个PCA维度）和GMM（5个PCA维度）方法，根据12个不同的特征进行聚类，以确定我的顶级客户。K-Means的两个输出产生了几乎相似的最佳客户集（每种情况下有1182个客户，重叠1156个），而GMM方法产生了660个客户作为我的顶级客户。这660名客户都参与了K-Means方法

现在我想确定我的顶级客户是谁。你能提出一些统计方法吗？我可以用这些方法来表示，X数量的客户确实是我的最佳客户群，并对他们进行一些A/B测试？我不想使用完整的识别集，因为为这么多的客户做计划可能会花费我更多。

尝试一些好的旧过滤！选择一个或多个功能，创建您自己的指标（可能顶级客户是购买最多的客户，或者是那些更忠诚/与公司关系更长久的客户，或者是这两个因素的加权和），对集群中的660个客户进行排序，并只选择前N个客户，N是您允许的最大客户数。
我不确定您在这里所说的“顶级”或“最佳”到底是什么意思，但是如果你想从集群中选出最具代表性的客户，你可以选择距离K-means的质心最近的客户，或者在GMM的相应高斯分布中概率密度最高的客户。@jdehesa:我同意这是上下文性质的。。。然而，我很想知道是否有任何统计方法可以更容易地筛选出最好的？