Nlp 查找实体和词性标记文本的推理/提取信息_Nlp_Nltk_Named Entity Recognition_Gate

Nlp 查找实体和词性标记文本的推理/提取信息

nlp

Nlp 查找实体和词性标记文本的推理/提取信息,nlp,nltk,named-entity-recognition,gate,Nlp,Nltk,Named Entity Recognition,Gate,让我们假设我从以下文本开始： I love Toyota Camrys and hate Ferraris 我使用像Stanford CoreNLP这样的POS标记器，并得到以下注释： I_PRP love_VBP Toyota_NNP Camrys_NNPS and_CC hate_VB Ferraris_NNP 让我们假设我有一个命名实体识别器，并且能够根据上述符号识别凯美瑞和法拉利我希望能够对上述句子进行推理，例如，我推断出以下内容：我讨厌凯美瑞我喜欢法拉利甚至可能：我

让我们假设我从以下文本开始：

I love Toyota Camrys and hate Ferraris

我使用像Stanford CoreNLP这样的POS标记器，并得到以下注释：

I_PRP love_VBP Toyota_NNP Camrys_NNPS and_CC hate_VB Ferraris_NNP

让我们假设我有一个命名实体识别器，并且能够根据上述符号识别凯美瑞和法拉利

我希望能够对上述句子进行推理，例如，我推断出以下内容：

我讨厌凯美瑞
我喜欢法拉利

甚至可能：

我讨厌丰田制造的东西
我讨厌法拉利制造的东西

我目前正在使用手动编码的启发式和时隙匹配来执行上述操作

问：有没有更标准的方法来实现这一点

例如，我从Gate运行到JAPE Java Annotation Patterns Engine——这是工具链的一部分做的事情吗

1）写你自己的日语语法。这并不像看上去那么难。网上有很多日本手册。首先，对于

“gate-jape-manual”

来说，似乎可以启动了。此外，GATE ANNIE现有的日语语法可以为您的任务提供很好的示例和想法

开始时，您会尝试为GATE Gazetter创建自己的词典，其中包含品牌名称条目（丰田、法拉利、e.t.c.），以创建“查找”注释。那么你的日本规则将包含如下规则

规则：LoveBrand
(
{Token.kind==word，Token.string=“I”}
{Token.kind==word，Token.string=“love”}
{Lookup.majorType==“品牌”}
)：标签
-->
：label.preference={rule=“LoveBrand”}

2）用在大门上。它将为依赖项和树节点创建两种类型的注释。依赖项是成对词之间的类型化链接，树节点是折叠成树的依赖项。只要试着在GATE Developer GUI中使用Parser_Stanford插件，您就会知道如何在任务中使用它

你可以处理你的

“我爱丰田凯美瑞，恨法拉利。”

继续，看看斯坦福解析器能做些什么。尤其需要类型为

dobj

的依赖项。如果您想使用其他斯坦福依赖项，则有一个包含所有可能依赖项的描述

用于GATE的Parser_Stanford插件只是将Stanford依赖项的注释添加到您的文档中。您可以使用JAPE语法添加GATE Transformer处理资源，并将其添加到GATE Developer中的处理资源序列中，在Parser_Stanford之后处理为Stanford依赖项创建的注释。

您是否尝试查看依赖项解析树？@ChthonicProject，--我想我应该把它加到我的阅读清单上。谢谢你详细的回答。你的回答基本上是说走关卡/日本路线。有没有竞争的方法？其他开源工具？@user1172468-你可以看看UIMA（）、OpenNLP（）和NLTK（）项目。谢谢你，我看过OpenNLP和ntlk，但没有看过UIMA。谢谢