Nlp 语言处理-同义词分析
我正在开发一个web应用程序,它可以分析一个单词,而它的同义词恰好出现在一堆段落中。 累积单词及其同义词在段落中出现的次数 目前我发现一些API,比如twinword.com,只在两句话中有相似之处。有没有能够完成任务的API或工具服务Nlp 语言处理-同义词分析,nlp,synonym,Nlp,Synonym,我正在开发一个web应用程序,它可以分析一个单词,而它的同义词恰好出现在一堆段落中。 累积单词及其同义词在段落中出现的次数 目前我发现一些API,比如twinword.com,只在两句话中有相似之处。有没有能够完成任务的API或工具服务 非常感谢 Word2Vec就是这样一种技术。将单词转换为向量的神经网络,训练神经网络根据上下文将单词分组 其思想是,具有相似语义属性的单词在大量文本中共享可比较的上下文。您可以使用这样的模型来检索类似的单词 这是一个简单的示例,使用预先训练的模型()。请注意,该
非常感谢 Word2Vec就是这样一种技术。将单词转换为向量的神经网络,训练神经网络根据上下文将单词分组 其思想是,具有相似语义属性的单词在大量文本中共享可比较的上下文。您可以使用这样的模型来检索类似的单词 这是一个简单的示例,使用预先训练的模型()。请注意,该型号是为荷兰产的,正好放在我的电脑上(这些型号可能相当大) 正如你所看到的,这种关系越强,分数就越高
请检查:有关更多文档的信息,您可以尝试使用另外两个Twinword API来获取所需内容 步骤1:获取相关单词 使用,您可以获得同义词和相关单词 例如,使用演示,单词“best”将以下关联及其相关性得分返回为“best”: 步骤2:将段落减少为关键字计数 之后,您可以使用将段落解析为一组“引理”或“根词” 返回:
"lemma": {
"rock": 2,
"hop": 1,
"frog": 1
}
步骤3:在您的程序中搜索和理货
然后,它只是一个简单的匹配
仅供参考:我为Twinword工作。没问题。如果您想了解更多详细信息,请告诉我。嗨,S van Balen,您是否有示例或示例应用程序/api可供展示?谢谢。当然,我会把它添加到答案中哦,别忘了也尝试一下这个方法:word_vectors.similous_by_word(“auto”),这应该会产生一个类似单词的列表,听起来像你在寻找的。
{
"unmatched": 2.5006557,
"unparalleled": 1.8664826,
"incomparable": 1.6736358,
"unsurpassed": 1.6117903,
"optimal": 1.576423,
"supreme": 1.5223511,
"superbly": 1.4789101,
"superior": 1.3964652,
"superiority": 1.3161669,
"superlative": 1.3032479,
"matchless": 1.3011634,
"better": 1.2848812,
"unrivaled": 1.2450347,
"foremost": 1.2047551,
"maximum": 1.1856474,
"excellent": 1.1767814,
"heyday": 1.0933546,
"unpaired": 1.0249922,
"optimum": 0.9539663,
"superb": 0.9439568,
"peerless": 0.92408043,
"premier": 0.91121525,
"ideal": 0.85982496,
"splendid": 0.8591815,
"nonpareil": 0.85686266,
"well": 0.85620004,
"apotheosis": 0.85186666,
"unequaled": 0.82653475,
"peak": 0.73392785,
"main": 0.6999291
}
The frogs hopped from rock to rock.
"lemma": {
"rock": 2,
"hop": 1,
"frog": 1
}