Nlp 两句话之间的距离
我正在寻找一种方法来测量两个句子之间的语义距离。假设我们有以下句子:Nlp 两句话之间的距离,nlp,semantics,linguistics,semantic-analysis,Nlp,Semantics,Linguistics,Semantic Analysis,我正在寻找一种方法来测量两个句子之间的语义距离。假设我们有以下句子: (S1) The beautiful cherry blossoms in Japan. (S2) The beautiful Japan. S2是从S1中删除“樱花”、“花朵”和“in”三个词而生成的。我想定义一个函数,给出S1和S2之间的一个很长的距离。原因是它们有着明显不同的含义,因为美丽修饰樱花而不是日本。正如罗布指出的,这是一个非常困难的问题。它要求程序不仅要理解语言语义,而且要有百科全书式的知识。例如,当我们说
(S1) The beautiful cherry blossoms in Japan.
(S2) The beautiful Japan.
S2是从S1中删除“樱花”、“花朵”和“in”三个词而生成的。我想定义一个函数,给出S1和S2之间的一个很长的距离。原因是它们有着明显不同的含义,因为美丽修饰樱花而不是日本。正如罗布指出的,这是一个非常困难的问题。它要求程序不仅要理解语言语义,而且要有百科全书式的知识。例如,当我们说“日本美丽的樱花”时,我们是在谈论一个美丽的樱花,而它恰好在日本开花,还是我们在谈论一个单一的集体实体“樱花”,它美丽而恰好在日本?这需要百科全书和语言知识的结合 <> P>从纯百科全书的角度,考虑句子
这远远不能完全解决测量语义距离的问题,但是我希望它能给你一个起点。我认为这方面的研究已经取得了很多进展,现在由于单词向量和变换器的发展,句子之间的距离可以通过几种方法计算出来:
etc尝试基于BERT的模型,例如 移动核心: 这对于捕捉两个句子的语义相似性非常有用。参考文件:
此外,您可能需要查找诸如“STS”(语义-文本相似性)之类的任务。这是一个非常困难的问题。我所知道的最接近的任务是释义检测,你想确定两个句子是否在语义上相互牵连。我会研究word2vec,它在单词意义上做了一些非常棒的事情。