Python 3.x 带有Spacy python错误的多实体识别
我被一个问题困住了,正在向你寻求帮助。我正在尝试使用spacy训练多个实体 以下是我的列车数据Python 3.x 带有Spacy python错误的多实体识别,python-3.x,nlp,spacy,spacy-pytorch-transformers,Python 3.x,Nlp,Spacy,Spacy Pytorch Transformers,我被一个问题困住了,正在向你寻求帮助。我正在尝试使用spacy训练多个实体 以下是我的列车数据 response =[ ('java developer with java and html css javascript ', {'entities': [(0, 14, 'jobtitle'), (0 , 4, 'skills'), (34,37,'skills'), (38, 49, 'skills') ] }), ('looking for software engineer with ja
response =[
('java developer with java and html css javascript ',
{'entities': [(0, 14, 'jobtitle'),
(0 , 4, 'skills'),
(34,37,'skills'),
(38, 49, 'skills')
]
}),
('looking for software engineer with java python',
{
'entities': [
(12, 29, 'jobtitle'),
(40, 46, 'skills'),
(35,39,"skills")
]
})
]
这是我发布的列车代码
nlp = spacy.blank("en")
optimizer = nlp.begin_training()
for i in range(20):
random.shuffle(TRAIN_DATA)
for text, annotations in TRAIN_DATA:
nlp.update([text], [annotations], sgd=optimizer)
错误:
ValueError:[E103]正在尝试设置冲突的文档:'(0,14,'jobtitle')和'(0,4,'skills')'。令牌只能是一个实体的一部分,因此请确保您正在设置的实体不重叠。正如错误消息所解释的,spacy的NER模型不支持重叠的实体跨度,因此您无法使用这些注释训练模型。是否有计划在将来支持它们?