Python 3.x 在K中为每个集群绘制WordCloud表示集群

Python 3.x 在K中为每个集群绘制WordCloud表示集群,python-3.x,data-visualization,k-means,word-cloud,Python 3.x,Data Visualization,K Means,Word Cloud,我有一套BOW功能,而且我知道要使用的最好的n_集群。我需要帮助为每个集群绘制WordCloud,以便我们可以一次性分析每个集群中的单词 请参考任何一组弓形特征,并采取任何n_集群,我会把它与我的问题 考虑以下特征: ['aa', 'aahhhs', 'aback', 'abandon', 'abates', 'abbott', 'abby', 'abdominal', 'abiding', 'ability'] 和3作为簇的数目。假设您适合您的模型: from sklearn.cluster

我有一套
BOW功能
,而且我知道要使用的最好的
n_集群
。我需要帮助为每个集群绘制
WordCloud
,以便我们可以一次性分析每个集群中的单词

请参考任何一组弓形特征,并采取任何n_集群,我会把它与我的问题

考虑以下特征:

['aa', 'aahhhs', 'aback', 'abandon', 'abates', 'abbott', 'abby', 'abdominal', 'abiding', 'ability']

和3作为簇的数目。

假设您适合您的模型:

from sklearn.cluster import KMeans
kmeans_bow = KMeans(n_clusters=3, n_jobs=-1).fit(X_train_bow)
您安装的型号将有一个属性
kmeans\u bow.labels\u
。这基本上告诉您哪些数据点已分配给哪些集群。您可能需要使用
kmeans\u bow.labels\u.tolist()

因此,下一步将使用您的文字袋矢量器,使用
features=bow\u vect.get\u feature\u names()
获取要素名称,并为它们分配您在上面获得的相应标签


使用for循环迭代数据并生成包含每个标签对应的单词的列表。只需将这些列表作为文本传递给WordCloud类,并根据需要进行定制

假设您适合您的模型:

from sklearn.cluster import KMeans
kmeans_bow = KMeans(n_clusters=3, n_jobs=-1).fit(X_train_bow)
您安装的型号将有一个属性
kmeans\u bow.labels\u
。这基本上告诉您哪些数据点已分配给哪些集群。您可能需要使用
kmeans\u bow.labels\u.tolist()

因此,下一步将使用您的文字袋矢量器,使用
features=bow\u vect.get\u feature\u names()
获取要素名称,并为它们分配您在上面获得的相应标签

使用for循环迭代数据并生成包含每个标签对应的单词的列表。只需将这些列表作为文本传递给WordCloud类,并根据需要进行定制