Nlp 斯帕西纳:同一个词可以是两个不同实体的一部分吗?

Nlp 斯帕西纳:同一个词可以是两个不同实体的一部分吗?,nlp,stanford-nlp,spacy,feature-extraction,ner,Nlp,Stanford Nlp,Spacy,Feature Extraction,Ner,例如: 世界上最好的产品是雀巢饼干 实体: 品牌:雀巢 产品:雀巢饼干 上述实体是否有效,或者我是否应将其标记为: 实体: 品牌:雀巢 产品:曲奇 它会影响模型性能吗?来自: 实体识别器仅限于预测非重叠、非嵌套的跨度。训练数据应遵守相同的约束。若您愿意,您可以在数据中有两个带有不同注释的句子。不过,我不确定这是否会影响或有助于你的表现 如果希望spaCy学习恢复这两个注释,那么可以在管道中使用两个EntityRecognizer实例。您需要将实体注释移动到扩展属性中,因为您不希望第二个实体识别器

例如:

世界上最好的产品是雀巢饼干

实体:

品牌:雀巢

产品:雀巢饼干

上述实体是否有效,或者我是否应将其标记为:

实体:

品牌:雀巢

产品:曲奇

它会影响模型性能吗?

来自:

实体识别器仅限于预测非重叠、非嵌套的跨度。训练数据应遵守相同的约束。若您愿意,您可以在数据中有两个带有不同注释的句子。不过,我不确定这是否会影响或有助于你的表现

如果希望spaCy学习恢复这两个注释,那么可以在管道中使用两个EntityRecognizer实例。您需要将实体注释移动到扩展属性中,因为您不希望第二个实体识别器覆盖第一个实体识别器设置的实体

后果:

如果您想要一个单独的NER标签,您必须按如下方式进行标记:
实体:品牌:雀巢产品:曲奇

如果您想培训两个独立的NER标记员(一个用于品牌,一个用于产品),那么您可以这样做:
实体:品牌:雀巢产品:雀巢饼干