Nlp Word2Vec-单词嵌入是否发生变化?

Nlp Word2Vec-单词嵌入是否发生变化?,nlp,stanford-nlp,word2vec,word-embedding,Nlp,Stanford Nlp,Word2vec,Word Embedding,我只是想知道是否有两个句子- 银行在公共假日仍然关闭 不要靠近河岸 单词“bank”将有不同的单词嵌入,还是相同的单词嵌入?如果我们使用word2vec或glove?你不能有意义地在两个文本上训练一个密集的单词。您需要这些,以及数十个(或理想情况下数百个)在微妙变化的上下文中使用'bank'的更多示例,以便为'bank'获得一个好的词向量。(对于同一训练模型中的其他采样良好的单词,该单词向量仅与其他单词向量相比具有意义。) 让我们假设您有一个大型的、多样化的培训语料库,其中有许多上下文中的'ba

我只是想知道是否有两个句子-

  • 银行在公共假日仍然关闭
  • 不要靠近河岸

  • 单词“bank”将有不同的单词嵌入,还是相同的单词嵌入?如果我们使用word2vec或glove?

    你不能有意义地在两个文本上训练一个密集的单词。您需要这些,以及数十个(或理想情况下数百个)在微妙变化的上下文中使用
    'bank'
    的更多示例,以便为
    'bank'
    获得一个好的词向量。(对于同一训练模型中的其他采样良好的单词,该单词向量仅与其他单词向量相比具有意义。)

    让我们假设您有一个大型的、多样化的培训语料库,其中有许多上下文中的
    'bank'
    示例。你已经在语料库上训练了一个模型,word2vec或GLoVe

    然后,想象语料库被改变了,因此有相对更多的上下文包含了“河流”的意思。(也许,会添加一些新的文本来讨论自然、公园、划船和灌溉。)然后,你可以从头开始,在新的语料库上重新训练你的模型

    在新模型中,
    “河岸”
    (及相关词语)通常会被推到更多类似“河岸”的邻居

    总的来说,这些单词可能处于完全不同的坐标中,因为每次运行都包含了足够的随机性,可以大量改变单词的结尾位置。但它们的相对邻域和相对方向往往与后续运行具有相似的价值,并且示例组合中的更改将倾向于在一个方向或另一个方向上推动结果

    手套和word2vec都是这样:它们的最终结果都会受到交替词义相对优势的影响

    (在相关文献中,单词具有多种对比意义通常被称为“多义词”,因此像[多义词向量]这样的搜索应该会找到更多与您的问题相关的工作。)