Nlp 基于Wordnet的概念抽取

Nlp 基于Wordnet的概念抽取,nlp,semantics,text-mining,wordnet,Nlp,Semantics,Text Mining,Wordnet,我想知道如何使用WordNet从文本文档中提取概念。之前我使用了单词袋方法来衡量文本文档之间的相似性,然而,我希望使用文本的语义信息,因此希望从文档中提取概念。我了解Wordnet提供的Sysnet包含给定单词的同义词。 然而,我试图实现的是如何使用这些信息在文本数据中定义一个概念。我想知道在使用sysnet之前是否需要单独手动定义概念列表,然后将这些概念与sysnet进行比较 任何建议或链接都将不胜感激。我想你会发现,有太多的概念需要你自己去列举,这是不现实的。相反,你应该考虑使用预先存在的知

我想知道如何使用WordNet从文本文档中提取概念。之前我使用了单词袋方法来衡量文本文档之间的相似性,然而,我希望使用文本的语义信息,因此希望从文档中提取概念。我了解Wordnet提供的Sysnet包含给定单词的同义词。 然而,我试图实现的是如何使用这些信息在文本数据中定义一个概念。我想知道在使用sysnet之前是否需要单独手动定义概念列表,然后将这些概念与sysnet进行比较


任何建议或链接都将不胜感激。

我想你会发现,有太多的概念需要你自己去列举,这是不现实的。相反,你应该考虑使用预先存在的知识来源,例如,推特的内容,大的网站,或其他一些来源作为构建你的概念的基础。您可能会发现聚类算法对于定义这些属性很有用。就同义词而言。。。与一个概念相关的词语可能不一定是同义词(例如,关于对他人的情感强度,爱和恨可能与同一个概念相关),有些词语可能属于多个概念(例如,婚礼可能在爱情和婚姻概念中),所以我建议从synset到concept之间建立一些链接,这不是严格意义上的1:1。

我想你会发现,有太多的概念需要你自己去列举,这是不现实的。相反,你应该考虑使用预先存在的知识来源,例如,推特的内容,大的网站,或其他一些来源作为构建你的概念的基础。您可能会发现聚类算法对于定义这些属性很有用。就同义词而言。。。与一个概念相关的词语可能不一定是同义词(例如,关于对他人的情感强度,爱和恨可能与同一个概念相关),有些词语可能属于多个概念(例如,婚礼可能在爱情和婚姻概念中),因此,我建议从synset到概念之间建立一些并非严格意义上的1:1的链接。

我不理解,你是在尝试“关键词提取”吗?你所说的概念是什么意思?对不起,如果我的问题听起来很傻。我不明白,你是想做“关键词提取”吗?你所说的概念是什么意思?对不起,如果我的问题听起来很傻。