使用python在文本聚类中绘制单词

使用python在文本聚类中绘制单词,python,cluster-analysis,unsupervised-learning,Python,Cluster Analysis,Unsupervised Learning,我的聚类结果如下图所示 是否有类似fvid_集群的库可以生成如下所示的图?(使用PYTHON) 步骤1:将单词矢量化为矢量(每个大小为n) 步骤2:使用kmean将它们聚类为k个集群 步骤3:对步骤1中生成的向量运行PCA,并将它们减少到2维(例如x,y) 步骤4:在位置(x,y)处绘制单词,其中(x,y)是PCA从其大小为n的全尺寸向量中减少的尺寸。为在第2步中标识的词对应的簇涂上颜色(每个簇使用一种颜色) 绘图与您展示的不完全一样,但我喜欢使用两种工具来探索文本聚类的结果(两种工具都有P

我的聚类结果如下图所示

是否有类似fvid_集群的库可以生成如下所示的图?(使用PYTHON)

  • 步骤1:将单词矢量化为矢量(每个大小为n)
  • 步骤2:使用kmean将它们聚类为k个集群
  • 步骤3:对步骤1中生成的向量运行PCA,并将它们减少到2维(例如x,y)
  • 步骤4:在位置(x,y)处绘制单词,其中(x,y)是PCA从其大小为n的全尺寸向量中减少的尺寸。为在第2步中标识的词对应的簇涂上颜色(每个簇使用一种颜色)
绘图与您展示的不完全一样,但我喜欢使用两种工具来探索文本聚类的结果(两种工具都有Python绑定)

白蚁

UMAP

下面是使用NMF(来自我的论文)进行主题建模的结果


你试过Matplotlib了吗?你用哪个向量器将单词转换成向量?@mujjiga我用TfidfVectorizer@TuckYew你有没有办法创建上面的图表?你解决问题了吗@你能分享代码吗?先谢谢你。