Nlp 小写实体

Nlp 小写实体,nlp,stanford-nlp,named-entity-recognition,Nlp,Stanford Nlp,Named Entity Recognition,我面临着检测以小写字母开头的命名实体的问题。如果我只使用小写单词训练模型,那么准确度是合理的;然而,当模型使用完全大写的标记或甚至混合使用小写和大写进行训练时,结果非常糟糕。我尝试了斯坦福NLP小组提供的一些功能以及各种各样的句子,但没有得到我预期的结果。 我面临的问题的一个例子如下: 阿里在密歇根大学学习,现在他为美国海军工作。 我希望模型能够识别如下实体: “大学”:“设施” “密歇根州”:“设施” “阿里”:“人” “美国”:“组织” “海军”:“组织” 如果用作训练数据的.TSV文件

我面临着检测以小写字母开头的命名实体的问题。如果我只使用小写单词训练模型,那么准确度是合理的;然而,当模型使用完全大写的标记或甚至混合使用小写和大写进行训练时,结果非常糟糕。我尝试了斯坦福NLP小组提供的一些功能以及各种各样的句子,但没有得到我预期的结果。 我面临的问题的一个例子如下:

阿里在密歇根大学学习,现在他为美国海军工作。 我希望模型能够识别如下实体:

  • “大学”:“设施”
  • “密歇根州”:“设施”
  • “阿里”:“人”
  • “美国”:“组织”
  • “海军”:“组织”
如果用作训练数据的.TSV文件只包含小写字母,那么我可以得到上面的结果,否则结果会令人惊讶


任何帮助都是非常感谢的

如果您有小写文本或混合大小写文本,由于斯坦福NLP模型是在标准编辑数据上训练的,因此准确性可能会受到影响,但有两种有用的方法来解决此问题:

  • 一种方法是使用a正确地将文本大写,然后使用常规的NER模型处理生成的文本
  • 另一种方法是探索无案例模型,包括作为斯坦福NER一部分提供的模型
  • 你可以读更多