Nlp 从依赖树中提取(主语、谓语、宾语)

Nlp 从依赖树中提取(主语、谓语、宾语),nlp,rdf,stanford-nlp,question-answering,dependency-parsing,Nlp,Rdf,Stanford Nlp,Question Answering,Dependency Parsing,我对从问题中提取三元组(主语、谓语、宾语)感兴趣 例如,我想转换以下问题: 谁是美国总统的妻子 致: (x,isWifeOf,y)和wedge;(y,isPresidentof,美国) x和y是我们必须找到的未知数,以便回答这个问题(/\表示连词) 我已经阅读了很多关于这个主题的文章,我想使用现有的解析器(比如斯坦福解析器)来执行这个任务。我知道解析器输出两种类型的数据: 解析结构树(选区关系) 依赖关系树(依赖关系) 一些论文试图从解析结构树(例如)构建三元组,但是这种方法似乎太弱,无法处

我对从问题中提取三元组(主语、谓语、宾语)感兴趣

例如,我想转换以下问题:

谁是美国总统的妻子

致:

(x,isWifeOf,y)和wedge;(y,isPresidentof,美国)

x和y是我们必须找到的未知数,以便回答这个问题(/\表示连词)

我已经阅读了很多关于这个主题的文章,我想使用现有的解析器(比如斯坦福解析器)来执行这个任务。我知道解析器输出两种类型的数据:

  • 解析结构树(选区关系)
  • 依赖关系树(依赖关系)
一些论文试图从解析结构树(例如)构建三元组,但是这种方法似乎太弱,无法处理复杂的问题

另一方面,依赖树包含许多相关信息来执行三重提取。很多论文都声称这样做,但我没有发现任何一篇论文明确给出了详细的过程或算法。大多数时候,作者说他们分析依赖关系,根据一些他们没有给出的规则生成三元组


有人知道有哪篇论文有更多关于从问题的依赖树中提取(主语、谓语、宾语)的信息吗?

有一个不错的三重提取的实现。它构建在Python中流行的NLP库之上。您似乎对三重提取的底层算法特别感兴趣,因此,查看他们算法的源代码可能会给您一些启示。请参见此处:

这当然是一个有趣的问题,但它并不是堆栈溢出的主题。首先,它太宽泛了(因为可能会有很多很多答案),而对非现场资源、书籍等的请求也特别离题:(从最接近的原因来看):“要求我们推荐或查找书籍、工具、软件库、教程或其他非现场资源的问题对于堆栈溢出来说是离题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,请描述这个问题以及迄今为止为解决它所做的工作。“三元组没有一个标准形式(很多组合都是可能的)。在上面的例子中,”(x,isWifeOf,y)∧ (y,isPresidentof,USA)“优于”(x,isFirstLadyOf,USA)”,因为数据库(如DBpedia)与isFirstLadyOf相比,更可能包含isPresidentof或isWifeOf的条目。第一次,所有更正的三元组都很好……是的,我同意;我的观点是,您的问题没有关于您试图从给定文本中提取哪些三元组的技术规范。这是它太宽和开放的部分原因我的工作是“Projet Pensées Profondes”(Projet Pensées Profondes)的一部分,您可以在本文档中找到更多细节:(第5.1节)。算法()自从报告发布以来,已经有了很大的改进,我将在几个月后发表一篇文章,介绍改进情况。您提到使用解析树或依赖项解析,在我的研究中,我发现这两种方法通常都很有用。下面我介绍一下我的方法: