Python可视化K-聚类_Python_Nltk_K Means

Python可视化K-聚类

python

Python可视化K-聚类,python,nltk,k-means,Python,Nltk,K Means,我已经按照本教程介绍了使用NLTK包的K集群部分 The code for NLTK K-clustering is like this : X = model[model.wv.vocab] Cluster = 2 Kcluster = KMeansClusterer(Cluster,distance = nltk.cluster.util.cosine_distance,repeats = 25 ) ApplyCluster = Kcluster.cluster(model[abc.voca

我已经按照本教程介绍了使用NLTK包的K集群部分

The code for NLTK K-clustering is like this :
X = model[model.wv.vocab]
Cluster = 2
Kcluster = KMeansClusterer(Cluster,distance = nltk.cluster.util.cosine_distance,repeats = 25 )
ApplyCluster = Kcluster.cluster(model[abc.vocab], assign_clusters=True)

因此，我想把我们的结果形象化，但我不知道。我尝试了plot.scatter（），但在定义采用哪个参数时遇到了一些问题。

我的建议：

尝试两个维度的各种组合

使用

PCA

变换数据，并拾取前2个主成分

是一种非常好的可视化降维技术

编辑：您可以寻找绘图想法（技术，而不是数学）
编辑2：正如@Dan所提到的，这是一种基于相似矩阵的可视化降维技术，改进算法（因此t-sne）做得非常好

祝你好运

对于可视化来说，可能比PCAThanks@Dan更好，没错，我只是按照他的例子问了一个问题——如何选择属性。