Python Gensim Word2vec冻结一些WordVector并更新其他WordVector

Python Gensim Word2vec冻结一些WordVector并更新其他WordVector,python,word2vec,gensim,Python,Word2vec,Gensim,关于gensim的word2vec, 假设你已经在一个大语料库上训练了一个模型,你想用新句子中的新词来更新它,但不想更新已经有向量的词。 调用model.train时,是否可以冻结某些单词的向量并仅更新某些选定的单词,如新词? 或者也许有什么诀窍可以做到这一点? 谢谢。有!但这是一个实验性的特性,几乎没有文档——您需要阅读源代码才能完全理解它,并直接修改您的模型以利用它 查看word2vec.py源代码中以_lock结尾的属性–特别是在最新的代码中,一个名为vectors_lock的代码。它是一

关于gensim的word2vec, 假设你已经在一个大语料库上训练了一个模型,你想用新句子中的新词来更新它,但不想更新已经有向量的词。 调用model.train时,是否可以冻结某些单词的向量并仅更新某些选定的单词,如新词? 或者也许有什么诀窍可以做到这一点?
谢谢。

有!但这是一个实验性的特性,几乎没有文档——您需要阅读源代码才能完全理解它,并直接修改您的模型以利用它

查看word2vec.py源代码中以_lock结尾的属性–特别是在最新的代码中,一个名为vectors_lock的代码。它是一种面具,允许、削弱或停止某些单词的训练。对于每个单词,如果其值为1.0,则应用正常的完全反向传播更新。任何较低的值都会削弱更新–因此0.0会冻结一个单词以防更新。潜在的更新仍然是经过计算的——因此没有净加速——它只是在最终应用到特定的冻结单词之前乘以0.0