Python可视化K-聚类
我已经按照本教程介绍了使用NLTK包的K集群部分Python可视化K-聚类,python,nltk,k-means,Python,Nltk,K Means,我已经按照本教程介绍了使用NLTK包的K集群部分 The code for NLTK K-clustering is like this : X = model[model.wv.vocab] Cluster = 2 Kcluster = KMeansClusterer(Cluster,distance = nltk.cluster.util.cosine_distance,repeats = 25 ) ApplyCluster = Kcluster.cluster(model[abc.voca
The code for NLTK K-clustering is like this :
X = model[model.wv.vocab]
Cluster = 2
Kcluster = KMeansClusterer(Cluster,distance = nltk.cluster.util.cosine_distance,repeats = 25 )
ApplyCluster = Kcluster.cluster(model[abc.vocab], assign_clusters=True)
因此,我想把我们的结果形象化,但我不知道。我尝试了plot.scatter(),但在定义采用哪个参数时遇到了一些问题。我的建议:
PCA
变换数据,并拾取前2个主成分编辑2:正如@Dan所提到的,这是一种基于相似矩阵的可视化降维技术,改进算法(因此t-sne)做得非常好
祝你好运 对于可视化来说,可能比PCAThanks@Dan更好,没错,我只是按照他的例子问了一个问题——如何选择属性。