NLP:在块中解析共指代词

NLP:在块中解析共指代词,nlp,nltk,stanford-nlp,coreference-resolution,Nlp,Nltk,Stanford Nlp,Coreference Resolution,我计划在一本书的语料库上执行我的NLP管道。由于解决相互引用是一个密集的过程,我不可能一次处理一整本书,甚至一整章。我正计划将文本分成相当大的块,以解决相互引用问题 我需要帮助的问题是,当代词所引用的名词位于Group1中时,如何解析Group2中的代词。是否有方法将依赖项从Group1种子添加到以下组?如果没有,通常如何处理 不管它值多少钱,我都在使用CoreNLP,但我对其他人持开放态度 “第一组”:乔治出生在纽约。乔治10岁了 “第二组”:他热爱纽约市 这可能是有趣的阅读: 这里他们提到了

我计划在一本书的语料库上执行我的NLP管道。由于解决相互引用是一个密集的过程,我不可能一次处理一整本书,甚至一整章。我正计划将文本分成相当大的块,以解决相互引用问题

我需要帮助的问题是,当代词所引用的名词位于
Group1
中时,如何解析
Group2
中的代词。是否有方法将依赖项从
Group1
种子添加到以下组?如果没有,通常如何处理

不管它值多少钱,我都在使用CoreNLP,但我对其他人持开放态度

“第一组”:乔治出生在纽约。乔治10岁了

“第二组”:他热爱纽约市


这可能是有趣的阅读: 这里他们提到了最大距离设置。我记得在我使用coreNLP进行coref解析的某个时候修改了它。(但是直接在Java中;因为您已经用NLTK标记了您的问题;不确定在NLTK实现中是否也可以设置此选项)

我会在这里使用常识,尽量坚持概念块,即如果章节太大,尝试(几段)段落。也许您可以在后期处理中将提及链“粘合”在一起,但我想这不会立即变得简单