使用python分离Indi/abugida脚本中的元音和辅音

使用python分离Indi/abugida脚本中的元音和辅音,python,unicode,python-unicode,indic,Python,Unicode,Python Unicode,Indic,我正在尝试建立一个程序,帮助我将unicode abugida脚本转换为元音和辅音列表。我已经通过使用以下取自 然而,我的意图是进一步分离所有元音和辅音 E.g हिंदी = ह+इ+न+द+ई 这与印地语变成h+i+n+d+i一样,只是在印度语中,每个音素都被当作一个字符 我该怎么做?如何按每个字符解析字符串并将其与元音字母表的unicode匹配?因此基本上输入应该由分开的元音和辅音组成?我想我误解了原始问题,对不起。 E.g हिंदी = ह+इ+न+द+ई

我正在尝试建立一个程序,帮助我将unicode abugida脚本转换为元音和辅音列表。我已经通过使用以下取自

然而,我的意图是进一步分离所有元音和辅音

E.g हिंदी = ह+इ+न+द+ई 
这与印地语变成h+i+n+d+i一样,只是在印度语中,每个音素都被当作一个字符


我该怎么做?

如何按每个字符解析字符串并将其与元音字母表的unicode匹配?因此基本上输入应该由分开的元音和辅音组成?我想我误解了原始问题,对不起。
E.g हिंदी = ह+इ+न+द+ई