Nlp 根据关键字确定类别

Nlp 根据关键字确定类别,nlp,Nlp,在聚类过程之后,我得到了一些相似的单词。我想对这些词进行分类 例如,如果我有这样的话: 链接数据 领域本体语义网 用例 语义标注 也许正确的分类是语义网 我知道这类问题可以用NLP解决,但我是NLP新手,不知道从哪里开始。谁能告诉我正确的方法是什么?或者是否可以到达 注:我发现他们用搭配和词性标注解决了类似的问题。我可以把它应用于这个特定的问题吗?你可以搜索关于主题标签的论文——这通常被认为是一个相当困难的问题。不过,像下面这样的论文可能是一个很好的开始。作者还有一些其他相关的 刘建海、格里

在聚类过程之后,我得到了一些相似的单词。我想对这些词进行分类

例如,如果我有这样的话:

  • 链接数据
  • 领域本体语义网
  • 用例
  • 语义标注
也许正确的分类是语义网

我知道这类问题可以用NLP解决,但我是NLP新手,不知道从哪里开始。谁能告诉我正确的方法是什么?或者是否可以到达


注:我发现他们用搭配和词性标注解决了类似的问题。我可以把它应用于这个特定的问题吗?

你可以搜索关于主题标签的论文——这通常被认为是一个相当困难的问题。不过,像下面这样的论文可能是一个很好的开始。作者还有一些其他相关的


刘建海、格里泽、纽曼、鲍德温(2011年6月)。主题模型的自动标签。《计算语言学协会第49届年会论文集:人类语言技术第1卷》(第1536-1545页)。计算语言学协会。

Hmmm,这不完全是主题模型的标准参考,但却是一本非常好的主题模型读物!我认为主题模型的标准参考是:@Marc Tomlinson谢谢,绝对值得一读。我太喜欢看那份报纸了。我想做那个实验,并尝试自己的结果。如果有人想看的话,我会把文章的链接发给他们:@alvas这个网站有很多关于主题模型的信息。我想用我的主题术语试试LDA,看看它是如何工作的,因为我没有文档。我有一些关键字,我想关联一个标签,该关键字。我发现Apache Mahout有LDA。所以我会开始玩它。谢谢你们的建议,伙计们,如果还有其他建议,我将不胜感激。@alvas我用折叠变分Bayes算法执行LDA。我获取了一个集群,它是另一个进程的结果。我把论文中所有的关键词和标题作为输入数据。之后,我得到了一些类别标签,但我想丰富我的结果。那么,我可以用维基百科的垃圾堆做到这一点,我怎么能做到呢?因为在“主题模型的自动标签”的论文中,他们尝试了这个方法,并且得到了令人难以置信的结果。