Stanford nlp 用RegexNER替代CRF模型覆盖命名实体
我试图在任务中使用Stanford CoreNLP检测命名实体 我已经在我的RegexNER映射文件中给出了如下规则:Stanford nlp 用RegexNER替代CRF模型覆盖命名实体,stanford-nlp,Stanford Nlp,我试图在任务中使用Stanford CoreNLP检测命名实体 我已经在我的RegexNER映射文件中给出了如下规则: Train VEHICLE_TYPE 2.0 但它将列为刑事指控实体类型 我已经添加了这个选项ner.applyFinegured,并将其设置为true,这可能就是为什么它会被CoreNLP的CRF模型覆盖 我的问题是如何在RegexNER映射文件中添加这样的异常,或者是否有更好的方法。您应该使用以下设置: # run fine-grained NER with a
Train VEHICLE_TYPE 2.0
但它将列为刑事指控
实体类型
我已经添加了这个选项ner.applyFinegured
,并将其设置为true
,这可能就是为什么它会被CoreNLP的CRF模型覆盖
我的问题是如何在RegexNER映射文件中添加这样的异常,或者是否有更好的方法。您应该使用以下设置:
# run fine-grained NER with a custom rules file
java -Xmx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -ner.fine.regexner.mapping custom.rules -file example.txt -outputFormat text
您需要确保将ner.fine.regexner.mapping
设置到您的自定义规则文件,以使用该文件,而不是默认的细粒度规则,该规则将标记诸如CRIMINAL\u CHARGE
这是什么标志-ner.fine.regexner.mapping custom.rules
如果ner.applyFinegured
为true。该标志设置规则文件的内容。如果您不设置它,它将使用默认值。@StanfordNLPHelp请帮助