Stanford nlp 用RegexNER替代CRF模型覆盖命名实体

Stanford nlp 用RegexNER替代CRF模型覆盖命名实体,stanford-nlp,Stanford Nlp,我试图在任务中使用Stanford CoreNLP检测命名实体 我已经在我的RegexNER映射文件中给出了如下规则: Train VEHICLE_TYPE 2.0 但它将列为刑事指控实体类型 我已经添加了这个选项ner.applyFinegured,并将其设置为true,这可能就是为什么它会被CoreNLP的CRF模型覆盖 我的问题是如何在RegexNER映射文件中添加这样的异常,或者是否有更好的方法。您应该使用以下设置: # run fine-grained NER with a

我试图在任务中使用Stanford CoreNLP检测命名实体

我已经在我的RegexNER映射文件中给出了如下规则:

Train   VEHICLE_TYPE    2.0
但它将
列为
刑事指控
实体类型

我已经添加了这个选项
ner.applyFinegured
,并将其设置为
true
,这可能就是为什么它会被CoreNLP的CRF模型覆盖


我的问题是如何在RegexNER映射文件中添加这样的异常,或者是否有更好的方法。

您应该使用以下设置:

# run fine-grained NER with a custom rules file
java -Xmx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -ner.fine.regexner.mapping custom.rules -file example.txt -outputFormat text

您需要确保将
ner.fine.regexner.mapping
设置到您的自定义规则文件,以使用该文件,而不是默认的细粒度规则,该规则将标记诸如
CRIMINAL\u CHARGE

这是什么标志
-ner.fine.regexner.mapping custom.rules
如果
ner.applyFinegured
为true。该标志设置规则文件的内容。如果您不设置它,它将使用默认值。@StanfordNLPHelp请帮助