Stanford nlp 命名实体识别中的实体分割

Stanford nlp 命名实体识别中的实体分割,stanford-nlp,named-entity-recognition,Stanford Nlp,Named Entity Recognition,我一直在使用Stanford-NER标记器在文档中查找命名实体。我面临的问题如下所述:- 让句子成为这部电影由Ryan Fleck Anna Boden pair执导。 现在,内尔标签将瑞安标记为一个实体,弗莱克·安娜标记为另一个实体,博登标记为第三个实体。正确的标记应该是Ryan Fleck和Anna Boden 这是内尔标签机的问题吗?如果是,它能被处理吗 您可以尝试ApacheOpenLP,而不是使用StanfordCorenlp。有一个选项可用于根据训练数据训练模型。由于此模型依赖于您提

我一直在使用Stanford-NER标记器在文档中查找命名实体。我面临的问题如下所述:-

让句子成为
这部电影由Ryan Fleck Anna Boden pair执导。

现在,内尔标签将瑞安标记为一个实体,弗莱克·安娜标记为另一个实体,博登标记为第三个实体。正确的标记应该是Ryan Fleck和Anna Boden


这是内尔标签机的问题吗?如果是,它能被处理吗

您可以尝试ApacheOpenLP,而不是使用StanfordCorenlp。有一个选项可用于根据训练数据训练模型。由于此模型依赖于您提供的名称,因此它能够检测您感兴趣的名称。

如何

  • 把你的数据通过斯坦福大学的NER或其他的NER运行
  • 看看结果,找出所有的错误
  • 正确标记错误的结果并将其反馈到您的NER中
  • 泡沫,冲洗,重复
这是一种手动增压技术。但是你的NER可能不会通过这种方式学到太多东西

在本例中,似乎有一个新功能,即连字符名称,NER需要了解。为什么不编一堆连字符的名字,把它们放在一些文本中,给它们贴上标签,并在这方面训练你的NER呢

您应该通过添加更多功能、更多数据和培训来实现这一目标