Python可视化K-聚类

Python可视化K-聚类,python,nltk,k-means,Python,Nltk,K Means,我已经按照本教程介绍了使用NLTK包的K集群部分 The code for NLTK K-clustering is like this : X = model[model.wv.vocab] Cluster = 2 Kcluster = KMeansClusterer(Cluster,distance = nltk.cluster.util.cosine_distance,repeats = 25 ) ApplyCluster = Kcluster.cluster(model[abc.voca

我已经按照本教程介绍了使用NLTK包的K集群部分

The code for NLTK K-clustering is like this :
X = model[model.wv.vocab]
Cluster = 2
Kcluster = KMeansClusterer(Cluster,distance = nltk.cluster.util.cosine_distance,repeats = 25 )
ApplyCluster = Kcluster.cluster(model[abc.vocab], assign_clusters=True)
因此,我想把我们的结果形象化,但我不知道。我尝试了plot.scatter(),但在定义采用哪个参数时遇到了一些问题。

我的建议:

  • 尝试两个维度的各种组合
  • 使用
    PCA
    变换数据,并拾取前2个主成分
  • 是一种非常好的可视化降维技术
  • 编辑:您可以寻找绘图想法(技术,而不是数学)
    编辑2:正如@Dan所提到的,这是一种基于相似矩阵的可视化降维技术,改进算法(因此t-sne)做得非常好


    祝你好运

    对于可视化来说,可能比PCAThanks@Dan更好,没错,我只是按照他的例子问了一个问题——如何选择属性。