Python 在散点图中形象化一袋单词的最佳方式是什么_Python_Database_Python 2.7_Matplotlib_Data Science

Python 在散点图中形象化一袋单词的最佳方式是什么

python database python-2.7 matplotlib

Python 在散点图中形象化一袋单词的最佳方式是什么,python,database,python-2.7,matplotlib,data-science,Python,Database,Python 2.7,Matplotlib,Data Science,我有一个由大约60000个特征组成的单词包。每个特征代表一个尺寸。我想在一个缩小的2D空间中表示这个单词包。我该怎么做我看到了一个例子，它看起来更像我想要的，但实际上并不相同。在这个例子中，他们有两个变换，而我只有一个。因此，正如建议的，我不想使用管道。以下是我的代码，该代码将永久保留，不会显示任何错误消息： #myList contents about 800000 words bag_of_words = vec.fit_transform(myList) X = bag_of_words

我有一个由大约60000个特征组成的单词包。每个特征代表一个尺寸。我想在一个缩小的2D空间中表示这个单词包。我该怎么做

我看到了一个例子，它看起来更像我想要的，但实际上并不相同。在这个例子中，他们有两个变换，而我只有一个。因此，正如建议的，我不想使用管道。以下是我的代码，该代码将永久保留，不会显示任何错误消息：

#myList contents about 800000 words
bag_of_words = vec.fit_transform(myList)
X = bag_of_words.todense() #this is taking for ever
pca = PCA(n_components=2).fit(X)
data2D = pca.transform(X)
plt.scatter(data2D[:,0], data2D[:,1])
plt.show()

我还没有找到更好的选择，现在看来我做错了什么

在散点图中想象一袋单词的最佳方式是什么

这袋单词看起来像这样：

(0, 548)    3
(0, 4000)   6
(0, 15346)  1
(0, 23299)  1
(0, 22931)  2
(0, 32817)  1
(0, 51733)  1
(0, 38308)  6
(0, 14784)  1
(0, 146873) 1
 ....

请告诉我，我不反对投票，但我想知道为什么你的代码哪一行要花很长时间？那一行X=bag\u of\u words.todense（）我不知道为什么会发生这种情况

.todense（）

在处理稀疏矩阵时总是很快。如果没有这些数据，我就帮不上什么忙了。请告诉我，我在投票中没有问题，但我想知道为什么你的代码哪一行要花很长时间？那一行X=bag\u of\u words.todense（）我不知道为什么会发生这种情况

.todense（）

在处理稀疏矩阵时总是很快。没有数据就帮不了你。