Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/silverlight/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Nlp 独立于语言的命名实体识别工具_Nlp_Named Entity Recognition - Fatal编程技术网

Nlp 独立于语言的命名实体识别工具

Nlp 独立于语言的命名实体识别工具,nlp,named-entity-recognition,Nlp,Named Entity Recognition,有人知道有没有独立于语言的命名实体识别库吗 谢谢我对此表示怀疑 理论上,如果你有大量的带注释的语料库,你可以使用纯监督学习技术。然而,如果你不能使用依赖于语言的规则、启发法或特征,并且你正在寻找高精度和召回率,那么语料库的规模将是巨大的。我敢说,对于任何一种特定的人类口语,可能没有足够的注释数据来完成这项任务。支持世界上所有语言的现成工具肯定不存在。您是在寻找可以在自己的数据上进行训练的东西,还是一种处理多种语言的工具?如果是后者,有哪些语言?我喜欢为自己的语言马其顿语开发一个工具。我知道不可能

有人知道有没有独立于语言的命名实体识别库吗

谢谢

我对此表示怀疑


理论上,如果你有大量的带注释的语料库,你可以使用纯监督学习技术。然而,如果你不能使用依赖于语言的规则、启发法或特征,并且你正在寻找高精度和召回率,那么语料库的规模将是巨大的。我敢说,对于任何一种特定的人类口语,可能没有足够的注释数据来完成这项任务。

支持世界上所有语言的现成工具肯定不存在。您是在寻找可以在自己的数据上进行训练的东西,还是一种处理多种语言的工具?如果是后者,有哪些语言?我喜欢为自己的语言马其顿语开发一个工具。我知道不可能有一个独立的图书馆,但也许有一些对我没有什么帮助:)你可以选择任何一个好的,并对马其顿标记的数据进行再培训。这在斯坦福大学的CRF-NER中非常常见,尽管结果远不是完美的,但作为基线,它通常已经足够好了。