Python 如何使用NLTK获得命名实体识别的完整GPE?缺少全名或全城

Python 如何使用NLTK获得命名实体识别的完整GPE?缺少全名或全城,python,nltk,spacy,ner,Python,Nltk,Spacy,Ner,在使用NLTK进行NER建模期间,如何修复名称重复、获取全名和修复位置错误 导入nltk 从nltk导入ne_块、pos_标记、word_标记 马克、安妮莎和安·哈特韦在Crazybook工作。马克·安东尼(Mark Anthony)来自加纳,第二个人从印度搬到了圣地亚哥的疯狂贝尔科技公司(Crazy Bel Technologies),然后来到山景城(Mountain View)的酒店 对于nltk中发送的。发送的\u标记化(句子): 对于nltk.ne_块中的块(nltk.pos_标记(nl

在使用NLTK进行NER建模期间,如何修复名称重复、获取全名和修复位置错误

导入nltk 从nltk导入ne_块、pos_标记、word_标记

马克、安妮莎和安·哈特韦在Crazybook工作。马克·安东尼(Mark Anthony)来自加纳,第二个人从印度搬到了圣地亚哥的疯狂贝尔科技公司(Crazy Bel Technologies),然后来到山景城(Mountain View)的酒店

对于nltk中发送的。发送的\u标记化(句子): 对于nltk.ne_块中的块(nltk.pos_标记(nltk.word_标记(已发送)): 如果hasattr(块,“标签”): 打印(chunk.label(),“”.join(对于区块中的c,c[0]))

人名 人安妮莎 人安·哈特韦 组织疯狂书 人名 安东尼 加纳GPE 印度GPE 疯狂的人 GPE San GPE山

问题#1从输出中可以看出,人Mark#1和Mark#2 Anthony在上下文中都是相同的,您如何检测到这一点

第二个问题是关于将疯狂贝尔技术公司误认为是一个组织

问题#3是关于缺少圣地亚哥作为GPE,并且只检测到圣地亚哥,类似地,在最后一个案例中,只检测到Mountain而不是Mountain View