在NLP中使用深度学习时如何获得词向量表示

在NLP中使用深度学习时如何获得词向量表示,nlp,deep-learning,Nlp,Deep Learning,在NLP中使用深度学习时,如何获得单词向量表示?单词由一个固定长度的向量表示,有关更多详细信息,请参见。深度学习和NLP是非常复杂的主题,因此如果你真的想理解它们,你需要学习该领域的几门课程并阅读许多论文。有很多不同的技术可以将单词转换为向量表示,这是一个非常活跃的研究领域。如果你已经非常熟悉NLP和机器学习(包括深度学习),Socher's是一个很好的下一步 话虽如此(考虑到这是一个编程论坛),如果您现在只想使用其他人的工具快速获取向量表示,这在某些任务中可能很有用,那么您必须查看的一个库是w

在NLP中使用深度学习时,如何获得单词向量表示?单词由一个固定长度的向量表示,有关更多详细信息,请参见。

深度学习和NLP是非常复杂的主题,因此如果你真的想理解它们,你需要学习该领域的几门课程并阅读许多论文。有很多不同的技术可以将单词转换为向量表示,这是一个非常活跃的研究领域。如果你已经非常熟悉NLP和机器学习(包括深度学习),Socher's是一个很好的下一步


话虽如此(考虑到这是一个编程论坛),如果您现在只想使用其他人的工具快速获取向量表示,这在某些任务中可能很有用,那么您必须查看的一个库是word2vec。请查看其网站:。这是一个非常强大的工具,对于一些基本的东西,它可以在不需要太多知识的情况下使用。

要获取单词的单词向量,可以使用谷歌新闻300维单词向量模型

从此处或从此处下载模型
.

下载后,使用
gensim
python库加载模型,如下所示-

import gensim

# Load Google's pre-trained Word2Vec model.
model = gensim.models.Word2Vec.load_word2vec_format('./model/GoogleNews-vectors-negative300.bin', binary=True)  
然后,只需查询模型中与单词类似的单词对应的单词向量

model['usa']
它会为
usa
返回一个300维的单词向量

请注意,您可能找不到此模型中所有单词的单词向量。

此外,也可以使用其他模型来代替这一
谷歌新闻
模型。

Bengio的团队已经发布了他们的代码和一组预先训练过的嵌入。我不知道如何训练单词向量,你能帮我吗,这让我很困惑