Nlp 语言处理-同义词分析

Nlp 语言处理-同义词分析,nlp,synonym,Nlp,Synonym,我正在开发一个web应用程序,它可以分析一个单词,而它的同义词恰好出现在一堆段落中。 累积单词及其同义词在段落中出现的次数 目前我发现一些API,比如twinword.com,只在两句话中有相似之处。有没有能够完成任务的API或工具服务 非常感谢 Word2Vec就是这样一种技术。将单词转换为向量的神经网络,训练神经网络根据上下文将单词分组 其思想是,具有相似语义属性的单词在大量文本中共享可比较的上下文。您可以使用这样的模型来检索类似的单词 这是一个简单的示例,使用预先训练的模型()。请注意,该

我正在开发一个web应用程序,它可以分析一个单词,而它的同义词恰好出现在一堆段落中。 累积单词及其同义词在段落中出现的次数

目前我发现一些API,比如twinword.com,只在两句话中有相似之处。有没有能够完成任务的API或工具服务


非常感谢

Word2Vec就是这样一种技术。将单词转换为向量的神经网络,训练神经网络根据上下文将单词分组

其思想是,具有相似语义属性的单词在大量文本中共享可比较的上下文。您可以使用这样的模型来检索类似的单词

这是一个简单的示例,使用预先训练的模型()。请注意,该型号是为荷兰产的,正好放在我的电脑上(这些型号可能相当大)

正如你所看到的,这种关系越强,分数就越高


请检查:有关更多文档

的信息,您可以尝试使用另外两个Twinword API来获取所需内容

步骤1:获取相关单词 使用,您可以获得同义词和相关单词

例如,使用演示,单词“best”将以下关联及其相关性得分返回为“best”:

步骤2:将段落减少为关键字计数 之后,您可以使用将段落解析为一组“引理”或“根词”

返回:

"lemma": {
    "rock": 2,
    "hop": 1,
    "frog": 1
}
步骤3:在您的程序中搜索和理货 然后,它只是一个简单的匹配


仅供参考:我为Twinword工作。

没问题。如果您想了解更多详细信息,请告诉我。嗨,S van Balen,您是否有示例或示例应用程序/api可供展示?谢谢。当然,我会把它添加到答案中哦,别忘了也尝试一下这个方法:word_vectors.similous_by_word(“auto”),这应该会产生一个类似单词的列表,听起来像你在寻找的。
{
    "unmatched": 2.5006557,
    "unparalleled": 1.8664826,
    "incomparable": 1.6736358,
    "unsurpassed": 1.6117903,
    "optimal": 1.576423,
    "supreme": 1.5223511,
    "superbly": 1.4789101,
    "superior": 1.3964652,
    "superiority": 1.3161669,
    "superlative": 1.3032479,
    "matchless": 1.3011634,
    "better": 1.2848812,
    "unrivaled": 1.2450347,
    "foremost": 1.2047551,
    "maximum": 1.1856474,
    "excellent": 1.1767814,
    "heyday": 1.0933546,
    "unpaired": 1.0249922,
    "optimum": 0.9539663,
    "superb": 0.9439568,
    "peerless": 0.92408043,
    "premier": 0.91121525,
    "ideal": 0.85982496,
    "splendid": 0.8591815,
    "nonpareil": 0.85686266,
    "well": 0.85620004,
    "apotheosis": 0.85186666,
    "unequaled": 0.82653475,
    "peak": 0.73392785,
    "main": 0.6999291
}
The frogs hopped from rock to rock.
"lemma": {
    "rock": 2,
    "hop": 1,
    "frog": 1
}