德瓦那加里语文本处理(NLP)从哪里开始

德瓦那加里语文本处理(NLP)从哪里开始,nlp,text-processing,devanagari,Nlp,Text Processing,Devanagari,我是德夫纳加语NLP的新手,是否有任何团体或资源可以帮助我开始使用德夫纳加语NLP(主要是尼泊尔语或类似的印地语)。我想能够为Devanagaric开发字体,并做一些字体处理应用程序。如果有人(在这个领域工作)能给我一些建议,那将是非常值得赞赏的。 提前谢谢 是否有任何小组或资源可以帮助我开始使用Devnagaric语言的NLP 在Madan Puraskar Pustakalaya的领导下开发了尼泊尔语语料库。您可以从上述链接中提供的联系人处请求非商业用途的尼泊尔语语料库 Python的NLT

我是德夫纳加语NLP的新手,是否有任何团体或资源可以帮助我开始使用德夫纳加语NLP(主要是尼泊尔语或类似的印地语)。我想能够为Devanagaric开发字体,并做一些字体处理应用程序。如果有人(在这个领域工作)能给我一些建议,那将是非常值得赞赏的。 提前谢谢

是否有任何小组或资源可以帮助我开始使用Devnagaric语言的NLP

在Madan Puraskar Pustakalaya的领导下开发了尼泊尔语语料库。您可以从上述链接中提供的联系人处请求非商业用途的尼泊尔语语料库

Python的NLTK拥有印地语语料库。您可以使用

from nltk.corpus import indian
为了深入了解以德夫纳加里语为基础的NLP,我建议你阅读研究论文;还有很多工作要做,而且可能很难获得同样的内容

为了掌握基础知识,您可能应该研究语言检测、文本分类、情感分析等(最好基于语料库中的词性标记库)

关于问题的第二部分

我很确定字体开发不属于自然语言处理的范畴。你是说别的吗

我是德夫纳加语NLP的新手,是否有任何团体或资源可以帮助我开始使用德夫纳加语NLP(主要是尼泊尔语或类似的印地语)

您可以使用fasttext[提供的嵌入,并使用一些深入学习的RNN模型(如LSTM)进行文本分类、情感分析

您可以在这里找到一些用于命名实体识别的数据集[

有关处理印度语言的信息,请参见此处[

Nltk支持印度语言,用于词性标注和nlp相关任务,您可以在此处参考[