Nlp Spacy NER不识别小写实体

Nlp Spacy NER不识别小写实体,nlp,spacy,ner,Nlp,Spacy,Ner,我面临着检测以小写字母开头的命名实体的问题。我已经尝试了link上提供的解决方案。这似乎对我不起作用 ======有关spaCy的信息============= spaCy version 2.1.4 Platform Darwin-16.7.0-x86_64-i386-64bit Python version 3.6.5 Models en 预期产出为: south NNP GPE korea NNP GPE is VBZ a DT coun

我面临着检测以小写字母开头的命名实体的问题。我已经尝试了link上提供的解决方案。这似乎对我不起作用

======有关spaCy的信息=============

spaCy version    2.1.4
Platform         Darwin-16.7.0-x86_64-i386-64bit
Python version   3.6.5
Models           en
预期产出为:

south NNP GPE
korea NNP GPE
is VBZ 
a DT 
country NN 
in IN 
asia NNP 
但上述代码的输出是:

south JJ 
korea NN 
is VBZ 
a DT 
country NN 
in IN 
asia NNP 

NE识别器是机器学习的,因此依赖于它在训练数据中看到的最强特征

您可以使用truecaser/recaser,这是一种静态模型,用于以小写文本固定大小写,并将输出传递给spacy。您可以使用:

,一种机器翻译的预处理工具 ,一个使用NLTK的truecaser实现
或者,您可以尝试编辑和修改训练数据,使其也具有小写实体,但这是一个相当繁琐的过程。

NE识别器是机器学习的,因此依赖于训练数据中最强大的特征

您可以使用truecaser/recaser,这是一种静态模型,用于以小写文本固定大小写,并将输出传递给spacy。您可以使用:

,一种机器翻译的预处理工具 ,一个使用NLTK的truecaser实现 或者,您可以尝试编辑和修改培训数据,使其具有小写实体,但这是一个相当繁琐的过程

south JJ 
korea NN 
is VBZ 
a DT 
country NN 
in IN 
asia NNP