Nlp 句子的RDF表示

Nlp 句子的RDF表示,nlp,artificial-intelligence,rdf,Nlp,Artificial Intelligence,Rdf,我需要用RDF格式表示句子 换句话说,“John喜欢可口可乐”将自动表示为: Subject : John Predicate : Likes Object : Coke 有人知道我应该从哪里开始吗?是否有任何程序可以自动执行此操作,或者我需要从头开始执行所有操作?一个选项是使用GPL兼容许可证下的输出。您可以根据需要在这些输出和RDF节点之间定义转换层 看看你的“约翰喜欢可乐”的例子吧 看起来您需要句子的类型依赖项,例如,对于John喜欢可口可乐: nsubj(likes-2, John-

我需要用RDF格式表示句子

换句话说,“John喜欢可口可乐”将自动表示为:

Subject : John
Predicate : Likes
Object : Coke

有人知道我应该从哪里开始吗?是否有任何程序可以自动执行此操作,或者我需要从头开始执行所有操作?

一个选项是使用GPL兼容许可证下的输出。您可以根据需要在这些输出和RDF节点之间定义转换层


看看你的“约翰喜欢可乐”的例子吧

看起来您需要句子的类型依赖项,例如,对于
John喜欢可口可乐

 nsubj(likes-2, John-1)
 dobj(likes-2, coke-3)
我不知道有任何依赖项解析器直接生成RDF。然而,它们中的许多都以一种称为的标准化的制表符受限表示形式生成解析,并且从CoNLL-X转换为RDF应该不会太难

开源依赖项解析器

有许多解析器可以从中选择提取类型依赖项,包括以下最先进的开源选项:

  • -看
斯坦福语法分析器包括一个经过预训练的英语语法分析模型。要获取类型依赖项,您需要使用标志
-outputFormat typedDependencies

对于语法分析器,您可以下载英文模型

MSTParser包含一个200句的小英语训练集,您可以使用它创建自己的英语解析模型。然而,对这一小部分数据进行训练将损害结果解析器的准确性。因此,如果您决定使用这个解析器,那么最好使用可用的pretrain模型

上面链接的所有预训练模型都根据斯坦福依赖形式产生解析(,和)


在这三个解析器中,斯坦福解析器是最精确的。MaltParser是最快的,该软件包的某些配置能够进行解析。

注意,这仍然是一个活跃的研究领域。最好的语法分析器往往能很好地处理小句子,比如你的例子,但在“真实世界”的句子中往往会失败得很惨。你能告诉我们任何真实的、10多个单词的长句子的预期表示形式吗?(例如,“无政府主义是一种提倡无国籍社会的政治哲学,通常被定义为自治的自愿机构。”)看起来像是在问你所要求的有多少是可行的,而答案并不多。