Python 句子语义相似性与频率
我有一套逐字逐句的句子,我想做的是……如果两个句子有相同的意思,那么这些句子应该被原来的句子替换,然后,我要计算这些句子的频率 有没有一种方法可以在NLTK中实现?欢迎并感谢在这方面提出的任何建议。 我正在寻找NLP方法。Python 句子语义相似性与频率,python,nlp,nltk,Python,Nlp,Nltk,我有一套逐字逐句的句子,我想做的是……如果两个句子有相同的意思,那么这些句子应该被原来的句子替换,然后,我要计算这些句子的频率 有没有一种方法可以在NLTK中实现?欢迎并感谢在这方面提出的任何建议。 我正在寻找NLP方法。 谢谢我找到了一些论文,也许能给你一些解决这个问题的方法。他们使用WordNet,这是一个可用于检查单词相似性的语料库,可在NLTK上获得: 科利、考特尼和拉达·米哈尔恰。“测量文本的语义相似性”,《ACL语义等价和蕴涵实证建模研讨会论文集》。计算语言学协会,2005年。 --
谢谢我找到了一些论文,也许能给你一些解决这个问题的方法。他们使用WordNet,这是一个可用于检查单词相似性的语料库,可在NLTK上获得:
祝你好运,希望这对你有帮助>P>我会考虑使用一些更为新近的词/文档嵌入方法来解决句子相似度,如:
- -最近,该实施已添加到RASA NLU中-
- -这是与NLP任务相关的年度竞赛,语义-文本相似性也存在。这对你来说可能是一个很好的想法来源李>
一方面,句子嵌入可以很容易地用来比较句子,另一方面,你可以对单词嵌入进行平均/汇总,得到一个完整的句子嵌入。为了比较句子向量,可以使用余弦相似性等度量 Wordnet对于“单词”相似性来说可能不是个好主意。请参阅