Python 在无监督学习中处理班级不平衡

Python 在无监督学习中处理班级不平衡,python,k-means,unsupervised-learning,Python,K Means,Unsupervised Learning,我使用K-均值聚类,我不知道数据的真实标签。我使用PCA,我有4个簇。然而,集群似乎是不平衡的。 我想知道如何在这个无监督学习任务中解决班级不平衡的问题?是什么让你认为集群应该平衡?我想我有监督学习的心态,在这种心态下,班级不平衡是必须的。我真的不知道在无监督学习中是否应该如此。。。你能让我更清楚一点吗?如果你计划在另一个模型中使用这些集群作为一个特性,那么类的不平衡可能是一个问题,但是为了分成最明显的n个组,kmeans并不关心平衡。如果你有一栋价值100万美元的房子和一栋价值10万美元的50

我使用K-均值聚类,我不知道数据的真实标签。我使用PCA,我有4个簇。然而,集群似乎是不平衡的。
我想知道如何在这个无监督学习任务中解决班级不平衡的问题?

是什么让你认为集群应该平衡?我想我有监督学习的心态,在这种心态下,班级不平衡是必须的。我真的不知道在无监督学习中是否应该如此。。。你能让我更清楚一点吗?如果你计划在另一个模型中使用这些集群作为一个特性,那么类的不平衡可能是一个问题,但是为了分成最明显的n个组,kmeans并不关心平衡。如果你有一栋价值100万美元的房子和一栋价值10万美元的500美元的房子,那么单栋昂贵的房子应该属于它自己的房子群。谢谢克里斯,这是有道理的。实际上,我喜欢使用集群,然后将其输入到预测模型中。你对我应该如何处理这种情况下的班级不平衡有什么建议吗?