Stanford nlp 基于CoreNLP的法语依存分析

Stanford nlp 基于CoreNLP的法语依存分析,stanford-nlp,Stanford Nlp,我想用斯坦福大学的CoreNLP来写法语。词性标记和解析工作得很好,但在我的配置中,输出依赖关系根本没有意义 我的命令是 java -mx1g -cp "~/stanford-corenlp/stanford-corenlp-full-2015-12-09/*" edu.stanford.nlp.pipeline.StanfordCoreNLP -props french.conf -file /tmp/file.txt -outputFormat text 其中french.conf包含

我想用斯坦福大学的CoreNLP来写法语。词性标记和解析工作得很好,但在我的配置中,输出依赖关系根本没有意义

我的命令是

java -mx1g -cp "~/stanford-corenlp/stanford-corenlp-full-2015-12-09/*" 
edu.stanford.nlp.pipeline.StanfordCoreNLP -props french.conf 
-file /tmp/file.txt -outputFormat text
其中french.conf包含:

annotators = tokenize, ssplit, pos, depparse, parse
tokenize.language = fr
pos.model = edu/stanford/nlp/models/pos-tagger/french/french.tagger
parse.model = edu/stanford/nlp/models/lexparser/frenchFactored.ser.gz
depparse.model = edu/stanford/nlp/models/parser/nndep/UD_French.gz
我正在使用Corenlp3.6与发现的法国模型。在这方面,日志看起来不错:

[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator tokenize
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator ssplit
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator pos
Reading POS tagger model from edu/stanford/nlp/models/pos-tagger/french/french.tagger ... done [0,2 sec].
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator depparse
Loading depparse model file: edu/stanford/nlp/models/parser/nndep/UD_French.gz ... 
PreComputed 100000, Elapsed Time: 1.43 (s)
Initializing dependency parser done [3,4 sec].
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator parse
[main] INFO edu.stanford.nlp.parser.common.ParserGrammar -     Loading parser from serialized file edu/stanford/nlp/models/lexparser/frenchFactored.ser.gz ... 
done [3,0 sec].
但下面是“LeChat mange la souris”的结果(猫正在吃老鼠,结构完全相同)

这简直是胡说八道;这也不例外,我测试了很多句子,总是得到这样的结果。 这就是为什么我想我使用了一个错误的配置文件


任何帮助都将不胜感激

这是因为CoreNLP依赖项解析器希望获得作为输入的通用依赖项POS标记,而CoreNLP提供的法语POS标记器输出法语树库POS标记


我制作了一个补丁,可以转换法语POS标记器输出,以获得通用依赖POS标记:

对于那些感兴趣的人,斯坦福CoreNLP现在已经更新了他们的模型,它们现在工作得很好。

你找到解决方案了吗@喷气推进实验室
root(ROOT-0, chat-2)
det(chat-2, Le-1)
case(souris-5, mange-3)
det(souris-5, la-4)
nmod:mange(chat-2, souris-5)
punct(chat-2, .-6)