Stanford nlp 如何在StanfordCoreNLP中加载特定分类器_Stanford Nlp

Stanford nlp 如何在StanfordCoreNLP中加载特定分类器

stanford-nlp

Stanford nlp 如何在StanfordCoreNLP中加载特定分类器,stanford-nlp,Stanford Nlp,想知道是否有一种方法可以在StanfordCoreNLP中加载特定的classier。我试图解决一个问题，即默认情况下加载的三个分类器中的第三个分类器没有可靠地返回ner标记，从而导致应用程序中的不一致性。想知道加载english.all.3类对于基本命名实体标记来说已经足够好了，下面列表中其他两个类的相关性是什么 edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz edu/stanford/nlp/models/n

想知道是否有一种方法可以在StanfordCoreNLP中加载特定的classier。我试图解决一个问题，即默认情况下加载的三个分类器中的第三个分类器没有可靠地返回ner标记，从而导致应用程序中的不一致性。想知道加载english.all.3类对于基本命名实体标记来说已经足够好了，下面列表中其他两个类的相关性是什么

edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz

经过研究我得到了答案。我们可以使用ner.model加载特定的模型。想知道我们是否可以引用StanfordCoreNLP库jar中已经打包好的模型，而不是为此在项目工作目录中拥有模型的副本

Properties configuration = new Properties();
configuration.put("annotators", "tokenize,ssplit,pos,lemma,ner");
configuration.put("ner.model", "english.all.3class.distsim.crf.ser.gz");
StanfordCoreNLP coreNLP  = new StanfordCoreNLP(configuration);

Properties configuration = new Properties();
configuration.put("annotators", "tokenize,ssplit,pos,lemma,ner");
configuration.put("ner.model", "english.all.3class.distsim.crf.ser.gz");
StanfordCoreNLP coreNLP  = new StanfordCoreNLP(configuration);

是的，如果在模型jar中指定路径，您应该可以

基本上，您可以将“ner.model”设置为要使用的序列化crf的逗号分隔列表，因此如果您想排除其中一个，只需提供所需的两个模型就可以了

为了更清晰，这三个模型在不同的数据集上进行了训练

all.3类针对7个已标记（人员、组织、位置、无）的数据源进行培训

muc.7类根据muc-7命名实体任务中的数据进行培训，包括（日期、位置、资金、组织、百分比、人员、时间）。更多信息：

conll.4类根据conll 2003 NER语料库中的数据进行培训，包括（个人、组织、地点、杂项）

是的，如果您在模型jar中指定了路径，您应该可以

基本上，您可以将“ner.model”设置为要使用的序列化crf的逗号分隔列表，因此如果您想排除其中一个，只需提供所需的两个模型就可以了

为了更清晰，这三个模型在不同的数据集上进行了训练

all.3类针对7个已标记（人员、组织、位置、无）的数据源进行培训

muc.7类根据muc-7命名实体任务中的数据进行培训，包括（日期、位置、资金、组织、百分比、人员、时间）。更多信息：

conll.4类根据conll 2003 NER语料库中的数据进行培训，包括（个人、组织、地点、杂项）

感谢您的投入。这很有帮助。我在上发布了另一个问题，请让我知道如何获得帮助。如果是bug，我应该如何通知斯坦福nlp团队知道这一点？感谢您的输入。这很有帮助。我在上发布了另一个问题，请让我知道如何获得帮助。如果是bug，我应该如何通知斯坦福nlp团队？