Stanford nlp 如何在StanfordCoreNLP中加载特定分类器

Stanford nlp 如何在StanfordCoreNLP中加载特定分类器,stanford-nlp,Stanford Nlp,想知道是否有一种方法可以在StanfordCoreNLP中加载特定的classier。我试图解决一个问题,即默认情况下加载的三个分类器中的第三个分类器没有可靠地返回ner标记,从而导致应用程序中的不一致性。想知道加载english.all.3类对于基本命名实体标记来说已经足够好了,下面列表中其他两个类的相关性是什么 edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz edu/stanford/nlp/models/n

想知道是否有一种方法可以在StanfordCoreNLP中加载特定的classier。我试图解决一个问题,即默认情况下加载的三个分类器中的第三个分类器没有可靠地返回ner标记,从而导致应用程序中的不一致性。想知道加载english.all.3类对于基本命名实体标记来说已经足够好了,下面列表中其他两个类的相关性是什么

edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz


经过研究我得到了答案。我们可以使用ner.model加载特定的模型。想知道我们是否可以引用StanfordCoreNLP库jar中已经打包好的模型,而不是为此在项目工作目录中拥有模型的副本

Properties configuration = new Properties();
configuration.put("annotators", "tokenize,ssplit,pos,lemma,ner");
configuration.put("ner.model", "english.all.3class.distsim.crf.ser.gz");
StanfordCoreNLP coreNLP  = new StanfordCoreNLP(configuration);

经过研究我得到了答案。我们可以使用ner.model加载特定的模型。想知道我们是否可以引用StanfordCoreNLP库jar中已经打包好的模型,而不是为此在项目工作目录中拥有模型的副本

Properties configuration = new Properties();
configuration.put("annotators", "tokenize,ssplit,pos,lemma,ner");
configuration.put("ner.model", "english.all.3class.distsim.crf.ser.gz");
StanfordCoreNLP coreNLP  = new StanfordCoreNLP(configuration);

是的,如果在模型jar中指定路径,您应该可以

基本上,您可以将“ner.model”设置为要使用的序列化crf的逗号分隔列表,因此如果您想排除其中一个,只需提供所需的两个模型就可以了

为了更清晰,这三个模型在不同的数据集上进行了训练

all.3类针对7个已标记(人员、组织、位置、无)的数据源进行培训

muc.7类根据muc-7命名实体任务中的数据进行培训,包括(日期、位置、资金、组织、百分比、人员、时间)。更多信息:

conll.4类根据conll 2003 NER语料库中的数据进行培训,包括(个人、组织、地点、杂项)


是的,如果您在模型jar中指定了路径,您应该可以

基本上,您可以将“ner.model”设置为要使用的序列化crf的逗号分隔列表,因此如果您想排除其中一个,只需提供所需的两个模型就可以了

为了更清晰,这三个模型在不同的数据集上进行了训练

all.3类针对7个已标记(人员、组织、位置、无)的数据源进行培训

muc.7类根据muc-7命名实体任务中的数据进行培训,包括(日期、位置、资金、组织、百分比、人员、时间)。更多信息:

conll.4类根据conll 2003 NER语料库中的数据进行培训,包括(个人、组织、地点、杂项)


感谢您的投入。这很有帮助。我在上发布了另一个问题,请让我知道如何获得帮助。如果是bug,我应该如何通知斯坦福nlp团队知道这一点?感谢您的输入。这很有帮助。我在上发布了另一个问题,请让我知道如何获得帮助。如果是bug,我应该如何通知斯坦福nlp团队?