Nlp 如何使用word2vec在文本中找到最有意义的单词?

Nlp 如何使用word2vec在文本中找到最有意义的单词?,nlp,word2vec,Nlp,Word2vec,例如,我输入了一些具有语义的句子,作为输出,我得到了一些最近的(余弦距离)单词(大部分是单个单词)列表 但我想知道我的句子属于哪一类,并计算每个单词离它有多远。并从句子中删除无意义的单词 例如: “我想买一个比萨饼” “披萨”:0.99123 “买入”:0.7834 “想要”:0.1443 在没有任何C代码的情况下,如何实现这种开箱即用的要求 也许我需要计算这个的余弦距离方程 谢谢大家! 似乎您需要主题建模,而不是word2vec。Word2vec用于捕获本地信息,直接使用它对单词或句子进行分类

例如,我输入了一些具有语义的句子,作为输出,我得到了一些最近的(余弦距离)单词(大部分是单个单词)列表

但我想知道我的句子属于哪一类,并计算每个单词离它有多远。并从句子中删除无意义的单词

例如:

“我想买一个比萨饼”

“披萨”:0.99123

“买入”:0.7834

“想要”:0.1443

在没有任何C代码的情况下,如何实现这种开箱即用的要求

也许我需要计算这个的余弦距离方程


谢谢大家!

似乎您需要主题建模,而不是word2vec。Word2vec用于捕获本地信息,直接使用它对单词或句子进行分类或聚类不是一个好主意

另一个方面是停止删除单词,因为您提到的是无意义的单词。顺便说一下,它们不是没有意义的,它们实际上与任何主题都不一致。所以,你认为它们没有意义

我认为您应该使用LDA主题建模方法,并且您不需要实现任何东西,因为LDA有很多实现