Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/redis/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Nlp 查找实体和词性标记文本的推理/提取信息_Nlp_Nltk_Named Entity Recognition_Gate - Fatal编程技术网

Nlp 查找实体和词性标记文本的推理/提取信息

Nlp 查找实体和词性标记文本的推理/提取信息,nlp,nltk,named-entity-recognition,gate,Nlp,Nltk,Named Entity Recognition,Gate,让我们假设我从以下文本开始: I love Toyota Camrys and hate Ferraris 我使用像Stanford CoreNLP这样的POS标记器,并得到以下注释: I_PRP love_VBP Toyota_NNP Camrys_NNPS and_CC hate_VB Ferraris_NNP 让我们假设我有一个命名实体识别器,并且能够根据上述符号识别凯美瑞和法拉利 我希望能够对上述句子进行推理,例如,我推断出以下内容: 我讨厌凯美瑞 我喜欢法拉利 甚至可能: 我

让我们假设我从以下文本开始:

I love Toyota Camrys and hate Ferraris
我使用像Stanford CoreNLP这样的POS标记器,并得到以下注释:

I_PRP love_VBP Toyota_NNP Camrys_NNPS and_CC hate_VB Ferraris_NNP
让我们假设我有一个命名实体识别器,并且能够根据上述符号识别凯美瑞和法拉利

我希望能够对上述句子进行推理,例如,我推断出以下内容:

  • 我讨厌凯美瑞
  • 我喜欢法拉利
甚至可能:

  • 我讨厌丰田制造的东西
  • 我讨厌法拉利制造的东西
我目前正在使用手动编码的启发式和时隙匹配来执行上述操作

问:有没有更标准的方法来实现这一点


例如,我从Gate运行到JAPE Java Annotation Patterns Engine——这是工具链的一部分做的事情吗

1) 写你自己的日语语法。这并不像看上去那么难。网上有很多日本手册。首先,对于
“gate-jape-manual”
来说,似乎可以启动了。此外,GATE ANNIE现有的日语语法可以为您的任务提供很好的示例和想法

开始时,您会尝试为GATE Gazetter创建自己的词典,其中包含品牌名称条目(丰田、法拉利、e.t.c.),以创建“查找”注释。那么你的日本规则将包含如下规则

规则:LoveBrand
(
{Token.kind==word,Token.string=“I”}
{Token.kind==word,Token.string=“love”}
{Lookup.majorType==“品牌”}
):标签
-->
:label.preference={rule=“LoveBrand”}

2) 用在大门上。它将为依赖项和树节点创建两种类型的注释。依赖项是成对词之间的类型化链接,树节点是折叠成树的依赖项。只要试着在GATE Developer GUI中使用Parser_Stanford插件,您就会知道如何在任务中使用它

你可以处理你的
“我爱丰田凯美瑞,恨法拉利。”
继续,看看斯坦福解析器能做些什么。尤其需要类型为
dobj
的依赖项。如果您想使用其他斯坦福依赖项,则有一个包含所有可能依赖项的描述


用于GATE的Parser_Stanford插件只是将Stanford依赖项的注释添加到您的文档中。您可以使用JAPE语法添加GATE Transformer处理资源,并将其添加到GATE Developer中的处理资源序列中,在Parser_Stanford之后处理为Stanford依赖项创建的注释。

您是否尝试查看依赖项解析树?@ChthonicProject,--我想我应该把它加到我的阅读清单上。谢谢你详细的回答。你的回答基本上是说走关卡/日本路线。有没有竞争的方法?其他开源工具?@user1172468-你可以看看UIMA()、OpenNLP()和NLTK()项目。谢谢你,我看过OpenNLP和ntlk,但没有看过UIMA。谢谢