斯坦福CoreNLP的其他命名实体识别模型?

斯坦福CoreNLP的其他命名实体识别模型?,nlp,stanford-nlp,Nlp,Stanford Nlp,该库包含用于识别时间、位置、组织、人员、金钱、百分比和日期的模型。是否有其他组提供的其他通用模型可以识别其他内容 此外,如果我们要训练只识别乐队名称(例如),我们可以在打包的乐队名称之外运行我们的新模型,还是必须训练新模型来识别时间、地点、组织、人员、金钱、百分比、日期和乐队,如果我们想这样做的话?文档中确实指出,现有模型本身无法扩展。您完全可以训练CRFClassizer或RegexNER识别波段名称,并将其与其他NER标记器合并,并且您的模块可以专门关注波段名称 我可能会建议使用RegexN

该库包含用于识别时间、位置、组织、人员、金钱、百分比和日期的模型。是否有其他组提供的其他通用模型可以识别其他内容


此外,如果我们要训练只识别乐队名称(例如),我们可以在打包的乐队名称之外运行我们的新模型,还是必须训练新模型来识别时间、地点、组织、人员、金钱、百分比、日期和乐队,如果我们想这样做的话?文档中确实指出,现有模型本身无法扩展。

您完全可以训练CRFClassizer或RegexNER识别波段名称,并将其与其他NER标记器合并,并且您的模块可以专门关注波段名称

我可能会建议使用RegexNER作为乐队名称。以下是链接:

基本上,您只需创建一个带名称的文件,或与带名称匹配的正则表达式,然后就可以使用标准管道根据自定义工作标记文本

下面是一个示例命令:

java -mx1g -cp "*:." edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators "tokenize,ssplit,pos,lemma,ner,regexner" -file sample_text.txt -regexner.mapping my-band-regexes.txt