Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x 可视化使用预训练单词嵌入SpaCy计算的余弦相似度分数_Python 3.x_Nlp_Spacy_Word Embedding - Fatal编程技术网

Python 3.x 可视化使用预训练单词嵌入SpaCy计算的余弦相似度分数

Python 3.x 可视化使用预训练单词嵌入SpaCy计算的余弦相似度分数,python-3.x,nlp,spacy,word-embedding,Python 3.x,Nlp,Spacy,Word Embedding,我使用SpaCy的预训练模型“en_core_web_lg”来寻找一组值和属性之间的余弦距离。我想想象一个单词与另一个单词之间的关系,非常类似于聚类 这里的列是我试图找到相似性分数的属性,而行是我试图找到最有可能被分类的属性的值 如果需要类似的绘图: 您需要将单词向量的维度减少到2个维度 因此,您必须对所需的词向量应用降维算法,例如(这也在scikit learn中实现) 相似性分数不足以做到这一点;你需要整向量 ,有一个关于t-SNE的很好的Kaggle教程,用于可视化单词向量。您可以自定义

我使用SpaCy的预训练模型“en_core_web_lg”来寻找一组值和属性之间的余弦距离。我想想象一个单词与另一个单词之间的关系,非常类似于聚类

这里的列是我试图找到相似性分数的属性,而行是我试图找到最有可能被分类的属性的值


如果需要类似的绘图: 您需要将单词向量的维度减少到2个维度

因此,您必须对所需的词向量应用降维算法,例如(这也在scikit learn中实现)

相似性分数不足以做到这一点;你需要整向量


,有一个关于t-SNE的很好的Kaggle教程,用于可视化单词向量。您可以自定义它,只选择您感兴趣的单词。

非常感谢您的回答!!我也尝试过PCA,我不知道为什么,但使用PCA降维比应用t-SNE降维效果更好。你知道为什么会发生这种情况吗?你可以读到:如果我的答案有用,请将其标记为已接受或评分。你检查了哪些内容了吗?