Nlp 基于维基百科的词语相似度算法

Nlp 基于维基百科的词语相似度算法,nlp,cluster-analysis,data-analysis,hierarchical-clustering,text-analysis,Nlp,Cluster Analysis,Data Analysis,Hierarchical Clustering,Text Analysis,我想计算两个单词之间的距离 Word1-曼彻斯特统一Word2-兰芝 我觉得使用维基百科将是一个非常好的选择。 我会尝试确定这两个词与同一类别或主题的距离。我可以使用什么算法来确定公共主题? 我的下一个问题是,我将如何获得共同主题下的继承权,以便计算单词之间的距离 我也想知道是否还有其他方法来计算两个单词之间的距离。如果这是一个简单高效的实现方法,那就太好了。为什么不使用已经在WIKI上培训过的工具呢 为什么不使用已经在WIKI上培训过的工具 这会返回两个单词之间的距离吗?如果单词的意思有歧义,

我想计算两个单词之间的距离

Word1-曼彻斯特统一Word2-兰芝

我觉得使用维基百科将是一个非常好的选择。 我会尝试确定这两个词与同一类别或主题的距离。我可以使用什么算法来确定公共主题? 我的下一个问题是,我将如何获得共同主题下的继承权,以便计算单词之间的距离


我也想知道是否还有其他方法来计算两个单词之间的距离。如果这是一个简单高效的实现方法,那就太好了。

为什么不使用已经在WIKI上培训过的工具呢

为什么不使用已经在WIKI上培训过的工具

这会返回两个单词之间的距离吗?如果单词的意思有歧义,它是如何工作的?是的,距离测量。因为它不支持词义。@Daniel你说的“已经训练”是什么意思?这难道不需要在维基百科上培训word2vec吗(这并不是那么简单)?有现成的培训选项吗?我的意思是,我链接的系统已经培训好,可以使用了。训练这样一个系统是一件非常痛苦的事情,可能需要几个星期才能完成,即使有一个非常好的工程。这会不会弥补这两个词之间的距离?如果单词的意思有歧义,它是如何工作的?是的,距离测量。因为它不支持词义。@Daniel你说的“已经训练”是什么意思?这难道不需要在维基百科上培训word2vec吗(这并不是那么简单)?有现成的培训选项吗?我的意思是,我链接的系统已经培训好,可以使用了。训练这样一个系统是一件非常痛苦的事情,可能需要几周的时间,即使有一个非常好的工程。