Stanford nlp 培训一名非英语教师
我看到了几篇关于为其他语言培训斯坦福大学的帖子 例如: 然而,斯坦福CRF分类器使用了一些语言相关的特征(例如:部分Speechs标记) 我们真的可以使用相同的Jar文件训练非英语模型吗?Stanford nlp 培训一名非英语教师,stanford-nlp,ner,french,Stanford Nlp,Ner,French,我看到了几篇关于为其他语言培训斯坦福大学的帖子 例如: 然而,斯坦福CRF分类器使用了一些语言相关的特征(例如:部分Speechs标记) 我们真的可以使用相同的Jar文件训练非英语模型吗? 训练NER分类器与语言无关。您必须提供高质量的培训数据并创建有意义的功能。关键是,并非所有特性对每种语言都同样有用。例如,大写是英语中命名实体的一个很好的指标。但在德语中,所有名词都大写,这使得这一特征不那么有用 在Stanford NER中,您可以决定分类器必须使用哪些功能,因此您可以禁用POS标记(事实上
训练NER分类器与语言无关。您必须提供高质量的培训数据并创建有意义的功能。关键是,并非所有特性对每种语言都同样有用。例如,大写是英语中命名实体的一个很好的指标。但在德语中,所有名词都大写,这使得这一特征不那么有用 在Stanford NER中,您可以决定分类器必须使用哪些功能,因此您可以禁用POS标记(事实上,它们在默认情况下是禁用的)。当然,你也可以用你想要的语言提供你自己的POS标签
我希望我能澄清一些事情。我同意前面的评论,即NER分类模型是独立于语言的 如果您对培训数据有疑问,我可以建议您使用大量不同语言的标记数据集 如果您想尝试其他模型,我建议ESTNLTK-爱沙尼亚语言库,但它可以适合独立于语言的ner模型()。 此外,您还可以找到如何使用spaCy训练ner模型的示例
我希望有帮助。祝你好运 是的,但只需为目标语言选择正确的功能即可识别命名实体