Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/google-cloud-platform/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Stanford nlp 培训一名非英语教师_Stanford Nlp_Ner_French - Fatal编程技术网

Stanford nlp 培训一名非英语教师

Stanford nlp 培训一名非英语教师,stanford-nlp,ner,french,Stanford Nlp,Ner,French,我看到了几篇关于为其他语言培训斯坦福大学的帖子 例如: 然而,斯坦福CRF分类器使用了一些语言相关的特征(例如:部分Speechs标记) 我们真的可以使用相同的Jar文件训练非英语模型吗? 训练NER分类器与语言无关。您必须提供高质量的培训数据并创建有意义的功能。关键是,并非所有特性对每种语言都同样有用。例如,大写是英语中命名实体的一个很好的指标。但在德语中,所有名词都大写,这使得这一特征不那么有用 在Stanford NER中,您可以决定分类器必须使用哪些功能,因此您可以禁用POS标记(事实上

我看到了几篇关于为其他语言培训斯坦福大学的帖子

例如:

然而,斯坦福CRF分类器使用了一些语言相关的特征(例如:部分Speechs标记)

我们真的可以使用相同的Jar文件训练非英语模型吗?

训练NER分类器与语言无关。您必须提供高质量的培训数据并创建有意义的功能。关键是,并非所有特性对每种语言都同样有用。例如,大写是英语中命名实体的一个很好的指标。但在德语中,所有名词都大写,这使得这一特征不那么有用

在Stanford NER中,您可以决定分类器必须使用哪些功能,因此您可以禁用POS标记(事实上,它们在默认情况下是禁用的)。当然,你也可以用你想要的语言提供你自己的POS标签


我希望我能澄清一些事情。

我同意前面的评论,即NER分类模型是独立于语言的

如果您对培训数据有疑问,我可以建议您使用大量不同语言的标记数据集

如果您想尝试其他模型,我建议ESTNLTK-爱沙尼亚语言库,但它可以适合独立于语言的ner模型()。 此外,您还可以找到如何使用spaCy训练ner模型的示例


我希望有帮助。祝你好运

是的,但只需为目标语言选择正确的功能即可识别命名实体