Python Spacy NER将实体拆分为两个单独的实体

Python Spacy NER将实体拆分为两个单独的实体,python,nlp,named-entity-recognition,spacy,Python,Nlp,Named Entity Recognition,Spacy,我正在做下面的课文 print([(i.text, i.label_) for i in doc.ents]) 我的文字看起来像 ZS L-1 Cocoa & Burgers Ltd - 2013 to 2017 我正在得到输出 ('ZS L-1', 'ORG'), ('Cocoa & Burgers Ltd', 'ORG'), ('2017', 'DATE') 如何正确获取组织名称 ('ZS L-1 Cocoa & Burgers Ltd', 'ORG') 此外

我正在做下面的课文

print([(i.text, i.label_) for i in doc.ents])
我的文字看起来像

ZS L-1 Cocoa & Burgers Ltd
-
2013 to 2017
我正在得到输出

('ZS L-1', 'ORG'), ('Cocoa & Burgers Ltd', 'ORG'), ('2017', 'DATE')
如何正确获取组织名称

('ZS L-1 Cocoa & Burgers Ltd', 'ORG')

此外,它未能将2013年作为日期实体。我的spacy版本是2.0,我使用的是这个模型-en_core_web_md-2.0.0。这通常发生在我对整个文本进行NER时。当我只写公司名称时,效果很好

我没有足够的声誉发表评论,因此在此处添加答案:

您有两种解决方案:

您可以根据自己的数据对模型进行培训:

第二个选项尝试下载大型模型,这次您使用的是中型模型:


您还可以比较小型和大型模型的输出:

这是答案,您需要按照@netplay的建议,对代表您所在领域的数据进行培训。