Nlp 查找实体和词性标记文本的推理/提取信息
让我们假设我从以下文本开始:Nlp 查找实体和词性标记文本的推理/提取信息,nlp,nltk,named-entity-recognition,gate,Nlp,Nltk,Named Entity Recognition,Gate,让我们假设我从以下文本开始: I love Toyota Camrys and hate Ferraris 我使用像Stanford CoreNLP这样的POS标记器,并得到以下注释: I_PRP love_VBP Toyota_NNP Camrys_NNPS and_CC hate_VB Ferraris_NNP 让我们假设我有一个命名实体识别器,并且能够根据上述符号识别凯美瑞和法拉利 我希望能够对上述句子进行推理,例如,我推断出以下内容: 我讨厌凯美瑞 我喜欢法拉利 甚至可能: 我
I love Toyota Camrys and hate Ferraris
我使用像Stanford CoreNLP这样的POS标记器,并得到以下注释:
I_PRP love_VBP Toyota_NNP Camrys_NNPS and_CC hate_VB Ferraris_NNP
让我们假设我有一个命名实体识别器,并且能够根据上述符号识别凯美瑞和法拉利
我希望能够对上述句子进行推理,例如,我推断出以下内容:
- 我讨厌凯美瑞
- 我喜欢法拉利
- 我讨厌丰田制造的东西
- 我讨厌法拉利制造的东西
例如,我从Gate运行到JAPE Java Annotation Patterns Engine——这是工具链的一部分做的事情吗 1) 写你自己的日语语法。这并不像看上去那么难。网上有很多日本手册。首先,对于
“gate-jape-manual”
来说,似乎可以启动了。此外,GATE ANNIE现有的日语语法可以为您的任务提供很好的示例和想法
开始时,您会尝试为GATE Gazetter创建自己的词典,其中包含品牌名称条目(丰田、法拉利、e.t.c.),以创建“查找”注释。那么你的日本规则将包含如下规则
规则:LoveBrand
(
{Token.kind==word,Token.string=“I”}
{Token.kind==word,Token.string=“love”}
{Lookup.majorType==“品牌”}
):标签
-->
:label.preference={rule=“LoveBrand”}
2) 用在大门上。它将为依赖项和树节点创建两种类型的注释。依赖项是成对词之间的类型化链接,树节点是折叠成树的依赖项。只要试着在GATE Developer GUI中使用Parser_Stanford插件,您就会知道如何在任务中使用它
你可以处理你的“我爱丰田凯美瑞,恨法拉利。”
继续,看看斯坦福解析器能做些什么。尤其需要类型为dobj
的依赖项。如果您想使用其他斯坦福依赖项,则有一个包含所有可能依赖项的描述
用于GATE的Parser_Stanford插件只是将Stanford依赖项的注释添加到您的文档中。您可以使用JAPE语法添加GATE Transformer处理资源,并将其添加到GATE Developer中的处理资源序列中,在Parser_Stanford之后处理为Stanford依赖项创建的注释。您是否尝试查看依赖项解析树?@ChthonicProject,--我想我应该把它加到我的阅读清单上。谢谢你详细的回答。你的回答基本上是说走关卡/日本路线。有没有竞争的方法?其他开源工具?@user1172468-你可以看看UIMA()、OpenNLP()和NLTK()项目。谢谢你,我看过OpenNLP和ntlk,但没有看过UIMA。谢谢