Nlp 在文本中执行语义分析

Nlp 在文本中执行语义分析,nlp,semantic-web,Nlp,Semantic Web,我想对一些类似YAGO的文本进行语义分析。但我在文本中没有确定实体和关系的结构。一种方法是使用词性标记,然后识别句子中的主语和谓语。但我仍然无法确定他们之间存在什么样的关系。 我该怎么做 例如: Albert Einstein was born in 1879. 应导致: AlbertEinstein BORNIN 1879 subject relation predicate 我的目标是寻找更好的方法来发现原始文本中的主语、谓词和关系。您试图解决的任务被称为语义分析,而语

我想对一些类似YAGO的文本进行语义分析。但我在文本中没有确定实体和关系的结构。一种方法是使用词性标记,然后识别句子中的主语和谓语。但我仍然无法确定他们之间存在什么样的关系。 我该怎么做

例如:

Albert Einstein was born in 1879.
应导致:

AlbertEinstein BORNIN   1879
subject        relation predicate

我的目标是寻找更好的方法来发现原始文本中的主语、谓词和关系。

您试图解决的任务被称为语义分析,而语义分析有更广泛的意义(老实说,我现在不能肯定它意味着什么)


关系提取是一个开放的研究问题,因此我建议对该领域进行回顾——例如,从书或论文的第2.3章开始(比2007年稍微老一点)。然后通过以下引用或链接引用继续研究;最后,尝试实现看起来最有希望的方法:例如,如果您知道您的数据非常正式(所有句子都很短,并且具有相似的严格结构),那么尝试类似于基于模式的方法;等等。

斯坦福解析器可以做到:)不过,您需要查看依赖项解析器。请查看本页底部::

主题:nsubj(拍摄,下雨), 或直接对象:dobj(关闭,轮毂))

或者查看此页面(斯坦福依赖项):

要理解注释,请查看以下内容:


对于您的特定示例,请使用Stanford“折叠的”依赖项解析器,它将为给定的句子生成类似born_in(Einstein,1879)的谓词,这与您想要的非常相似。

您试图做的基本上是理解自然语言,自然语言处理的一个分支,也是计算语言学的一个分支,通常被认为是工程学的分支

您可以进行语义分析或关系提取。两种方法都可以完成此任务。我决定通读Suchanek et al(2007),你会发现它是基于本体论的,关系被提取到预定义的本体论模板中,在该模板中对Aixom进行了预测(例如,BORNIN)。我个人认为这对一般智能来说是一个很大的限制,但对弱人工智能问题(狭窄的领域)非常有效。这些年来,更多有趣的工作正在发生,比如本体驱动的信息提取,算法是在本体上训练的,而不是用本体标注语料库。我想到的一个博士研究是麦克道尔论文和

不管怎样,在不偏离主题的情况下,目前有一个非常有趣的开源Python GUI驱动项目,名为iepy,由一家基于django的公司开发。它允许基于规则和基于机器学习的信息提取。我强烈建议你去看看->我自己试过了。而且,我不是这家公司的成员

根据文件:

IEPY是一个开源的信息提取工具,主要用于 关系抽取

举一个关系提取的例子,如果我们试图找到 出生日期:

约翰·冯·诺依曼(1903年12月28日至1957年2月8日)是一位杰出的艺术家 匈牙利和美国纯粹和应用数学家、物理学家、, 发明家和博学者。“然后,伊比的任务是识别”约翰·冯 “诺依曼”和“1903年12月28日”作为主体和客体的实体 “出生于”关系

它的目标是:用户需要在计算机上执行信息提取 大数据集。科学家们想用新的IE进行实验 算法


我不明白投反对票的原因。请检查我现在是否把问题说得更清楚了。