Stanford nlp 斯坦福nlp 3.7.0和3.9.2之间的性能下降

Stanford nlp 斯坦福nlp 3.7.0和3.9.2之间的性能下降,stanford-nlp,Stanford Nlp,斯坦福nlp 3.7.0版和3.9.2版的java性能似乎有所下降 我正在运行以下管道 props.put(“注释器”、“标记化、ssplit、pos、ner、解析、情感”) 以及以下属性 props.put("ner.model", "edu/stanford/nlp/models /ner/english.all.3class.distsim.crf.ser.gz"); props.put("ner.useSUTime", "false"); props.put

斯坦福nlp 3.7.0版和3.9.2版的java性能似乎有所下降

我正在运行以下管道

props.put(“注释器”、“标记化、ssplit、pos、ner、解析、情感”)

以及以下属性

props.put("ner.model",
            "edu/stanford/nlp/models    /ner/english.all.3class.distsim.crf.ser.gz");
props.put("ner.useSUTime", "false");
props.put("ner.applyNumericClassifiers", "false");
当我从3.7.0版升级到3.9.2版时,我看到了CPU峰值和性能下降。目前没有数字,但速度似乎慢了5倍左右

我正在分析少量文本。一篇小型新闻网站文章

也许我应该换一种型号? 还有人注意到这个吗

编辑:
我注意到3.9.2版本为RegeGenerator加载模型数据,但3.7.0没有,在日志中看到了这一点,不确定这是否有影响。

是的,原因是基于规则的NER现在默认运行

如果不需要细粒度命名实体,可以使用


props.put(“ner.applyfinegured”、“false”)

感谢您的回复。什么是细粒度命名实体?我只是在找人和组织。物业的最佳信息来源是什么?它们的用途是什么?是否有可能获得对我上次评论中问题的答复?拥有这些信息,而不是每次都问问题,这将是一件好事。感谢您的帮助。细粒度命名实体是统计模型找到的标记的更具体版本。例如位置-->(城市、州或省、国家)这里有更多信息:…转到关于细粒度NER的部分