Nlp 如何调整NeuralRef以获得更好的共指结果?

Nlp 如何调整NeuralRef以获得更好的共指结果?,nlp,python-3.7,spacy,Nlp,Python 3.7,Spacy,我使用的是NeuralRef——一个基于spaCy解析器的共同引用解析模块。吉特 然而,我得到的结果是可以改进的。huggingface(NeuralRef的开发者)提供的在线可视化工具给了我更准确的结果 我正在分析的文本: 伦敦是英国和英国的首都和人口最多的城市。它位于大不列颠岛东南部的泰晤士河上,两千年来一直是一个主要的定居点 我得到这个结果: doc._.coref_resolved 伦敦是英国和英国的首都和人口最多的城市。泰晤士河位于大不列颠岛东南部的泰晤士河上,两千年来一直是一个主

我使用的是NeuralRef——一个基于spaCy解析器的共同引用解析模块。吉特

然而,我得到的结果是可以改进的。huggingface(NeuralRef的开发者)提供的在线可视化工具给了我更准确的结果

我正在分析的文本: 伦敦是英国和英国的首都和人口最多的城市。它位于大不列颠岛东南部的泰晤士河上,两千年来一直是一个主要的定居点

我得到这个结果:

doc._.coref_resolved 
伦敦是英国和英国的首都和人口最多的城市。泰晤士河位于大不列颠岛东南部的泰晤士河上,两千年来一直是一个主要的定居点

因此,它错误地将伦敦与泰晤士河连接起来。(it->泰晤士河)

NeuralRef在线可视化工具返回正确的链接(it->London)

我已经尝试过调整参数,比如项目git页面上提到的greedyness、max_dist

有没有办法对其进行调整,以获得与可视化工具类似的结果

谢谢大家!

import spacy
nlp = spacy.load('en_core_web_lg')

import neuralcoref
neuralcoref.add_to_pipe(nlp,greedyness=0.5,store_scores=True)

text = "London is the capital and most populous city of England and   the United Kingdom. Standing on the River Thames in the south east of the island of Great Britain, it has been a major settlement for two millennia."# It was founded by the Romans, who named it Londinium."

doc = nlp(text)
print(doc._.coref_resolved)
doc._.coref_scores