Python 如何将不使用英语字母表的语言中的单词进行语法化?

Python 如何将不使用英语字母表的语言中的单词进行语法化?,python,nlp,nltk,lemmatization,Python,Nlp,Nltk,Lemmatization,我所说的非英语字母是指乌尔都语、印地语等语言。 有人能给我推荐一条路吗 注:不得标记为重复。这里的背景不同。我指的是完全不使用英语字母的语言。另一个问题通常指非英语的语言。用拉丁语、阿拉伯语、德瓦纳加里语或西里尔语书写的柠檬化语言之间没有区别。Unicode允许所有这些脚本(以及许多其他脚本)以相同的方式表示和处理,因此只要书写系统基于发音,就可以使用相同的技术和算法进行柠檬化 所以从技术上讲,你的问题和你链接的问题没有区别。尽管如此,我并没有将其标记为重复,因为您真正的问题是“如何将印地语/乌

我所说的非英语字母是指乌尔都语、印地语等语言。 有人能给我推荐一条路吗


注:不得标记为重复。这里的背景不同。我指的是完全不使用英语字母的语言。另一个问题通常指非英语的语言。

用拉丁语、阿拉伯语、德瓦纳加里语或西里尔语书写的柠檬化语言之间没有区别。Unicode允许所有这些脚本(以及许多其他脚本)以相同的方式表示和处理,因此只要书写系统基于发音,就可以使用相同的技术和算法进行柠檬化


所以从技术上讲,你的问题和你链接的问题没有区别。尽管如此,我并没有将其标记为重复,因为您真正的问题是“如何将印地语/乌尔都语柠檬化”,并且这个问题没有得到回答,因为这种语言不受模式的支持

对于印地语,你看到了吗?@fvu一个柠檬加工机会更好,但也要复杂得多。有一些关于这个主题的研究论文在四处飘荡,从阅读这些论文开始。