Nlp 独立于语言的命名实体识别工具

Nlp 独立于语言的命名实体识别工具,nlp,named-entity-recognition,Nlp,Named Entity Recognition,有人知道有没有独立于语言的命名实体识别库吗 谢谢我对此表示怀疑 理论上,如果你有大量的带注释的语料库,你可以使用纯监督学习技术。然而,如果你不能使用依赖于语言的规则、启发法或特征,并且你正在寻找高精度和召回率,那么语料库的规模将是巨大的。我敢说,对于任何一种特定的人类口语,可能没有足够的注释数据来完成这项任务。支持世界上所有语言的现成工具肯定不存在。您是在寻找可以在自己的数据上进行训练的东西,还是一种处理多种语言的工具?如果是后者,有哪些语言?我喜欢为自己的语言马其顿语开发一个工具。我知道不可能

有人知道有没有独立于语言的命名实体识别库吗

谢谢

我对此表示怀疑


理论上,如果你有大量的带注释的语料库,你可以使用纯监督学习技术。然而,如果你不能使用依赖于语言的规则、启发法或特征,并且你正在寻找高精度和召回率,那么语料库的规模将是巨大的。我敢说,对于任何一种特定的人类口语,可能没有足够的注释数据来完成这项任务。

支持世界上所有语言的现成工具肯定不存在。您是在寻找可以在自己的数据上进行训练的东西,还是一种处理多种语言的工具?如果是后者,有哪些语言?我喜欢为自己的语言马其顿语开发一个工具。我知道不可能有一个独立的图书馆,但也许有一些对我没有什么帮助:)你可以选择任何一个好的,并对马其顿标记的数据进行再培训。这在斯坦福大学的CRF-NER中非常常见,尽管结果远不是完美的,但作为基线,它通常已经足够好了。