Stanford nlp 培训一名非英语教师_Stanford Nlp_Ner_French

Stanford nlp 培训一名非英语教师

stanford-nlp

Stanford nlp 培训一名非英语教师,stanford-nlp,ner,french,Stanford Nlp,Ner,French,我看到了几篇关于为其他语言培训斯坦福大学的帖子例如：然而，斯坦福CRF分类器使用了一些语言相关的特征（例如：部分Speechs标记）我们真的可以使用相同的Jar文件训练非英语模型吗？训练NER分类器与语言无关。您必须提供高质量的培训数据并创建有意义的功能。关键是，并非所有特性对每种语言都同样有用。例如，大写是英语中命名实体的一个很好的指标。但在德语中，所有名词都大写，这使得这一特征不那么有用在Stanford NER中，您可以决定分类器必须使用哪些功能，因此您可以禁用POS标记（事实上

我看到了几篇关于为其他语言培训斯坦福大学的帖子

例如：

然而，斯坦福CRF分类器使用了一些语言相关的特征（例如：部分Speechs标记）

我们真的可以使用相同的Jar文件训练非英语模型吗？

训练NER分类器与语言无关。您必须提供高质量的培训数据并创建有意义的功能。关键是，并非所有特性对每种语言都同样有用。例如，大写是英语中命名实体的一个很好的指标。但在德语中，所有名词都大写，这使得这一特征不那么有用

在Stanford NER中，您可以决定分类器必须使用哪些功能，因此您可以禁用POS标记（事实上，它们在默认情况下是禁用的）。当然，你也可以用你想要的语言提供你自己的POS标签

我希望我能澄清一些事情。

我同意前面的评论，即NER分类模型是独立于语言的

如果您对培训数据有疑问，我可以建议您使用大量不同语言的标记数据集

如果您想尝试其他模型，我建议ESTNLTK-爱沙尼亚语言库，但它可以适合独立于语言的ner模型（）。此外，您还可以找到如何使用spaCy训练ner模型的示例

我希望有帮助。祝你好运

是的，但只需为目标语言选择正确的功能即可识别命名实体