Stanford nlp 使用CoreNLP神经系统在Conll-2012上再现中文共指结果时的空输出

Stanford nlp 使用CoreNLP神经系统在Conll-2012上再现中文共指结果时的空输出,stanford-nlp,Stanford Nlp,按照本页上的说明,以下是我在Conll-2012上复制中文共指结果时的代码: public class TestCoref { public static void main(String[] args) throws Exception { Properties props = StringUtils.argsToProperties(args); props.setProperty("props", "edu/stanford/nlp/coref/properties/

按照本页上的说明,以下是我在Conll-2012上复制中文共指结果时的代码:

public class TestCoref {

public static void main(String[] args) throws Exception {

    Properties props = StringUtils.argsToProperties(args);

    props.setProperty("props", "edu/stanford/nlp/coref/properties/neural-chinese-conll.properties");

    props.setProperty("coref.data", "path-to/data/conll-2012");

    props.setProperty("coref.conllOutputPath", "path-to-output/conll-results");

    props.setProperty("coref.scorer", "path-to/reference-coreference-scorers/v8.01/scorer.pl");


    CorefSystem coref = new CorefSystem(props);


    coref.runOnConll(props);

}
}

作为输出,我得到了如下3个文件:

“date-time.coref.predicted.txt

date-time.coref.gold.txt

date time.predicted.txt“

但它们都是空的

我的“conll-2012”数据如下:

首先,我从这个页面下载了train/dev/test关键数据,以及LDC提供的OnNote-release-5.0。然后我运行脚本skeleton2conll.sh,该脚本提供了官方的conll 2012数据,生成了_conll文件

我使用的模型在这里下载

当我试图找到问题时,我注意到类CorefSystem中存在一个函数“annotate”,它似乎完成了真正的工作,但根本没有使用它

我想知道RunonConnect函数中是否有一个不读取任何注释的bug,或者我如何重现共引用结果

附言:

我特别想在conll-2012中就“tc”和“bc”等对话数据得出一些结果。我发现使用coreferenceapi只能解析文本数据。除了在Conll-2012上运行外,是否还有其他方法可以在对话数据上使用神经Coref系统(应指明不同的说话人)


提前感谢您的帮助

首先,为什么不从命令行运行此命令:

java -Xmx10g -cp stanford-corenlp-3.9.1.jar:stanford-chine-corenlp-models-3.9.1.jar:* edu.stanford.nlp.coref.CorefSystem -props edu/stanford/nlp/coref/properties/neural-chinese-conll.properties -coref.data <path-to-conll-data> -coref.conllOutputPath <where-to-save-system-output> -coref.scorer <path-to-scoring-script>
java-Xmx10g-cp stanford-corenlp-3.9.1.jar:stanford-chine-corenlp-models-3.9.1.jar:*edu.stanford.nlp.coref.CorefSystem-props edu/stanford/nlp/coref/properties/neural-chinese-conll.properties-coref.data-coref.conllOutputPath-coref.scorer

我也尝试了这个命令行,它给出了相同的空结果文件我不知道这是否会影响事情,但我的命令中有一个输入错误,应该是:“stanford-corenlp-3.9.1-models-chinese.jar”。运行该命令时,能否在问题中发布输出?你能发布你正在运行的完整命令吗?您的类路径中可能没有中文模型jar,因此无法加载正确的共同引用模型。