Java中Unicode的音译而不使用Google Api?

Java中Unicode的音译而不使用Google Api?,java,unicode,unicode-string,transliteration,Java,Unicode,Unicode String,Transliteration,从英语unicode到古吉拉特邦unicode有什么解决方案吗? 假设unicode表示a=\u0061,那么它将进行转换અ = u0095Unicode CLDR提供了包含如何将拉丁语音译为古吉拉特语说明的文件。转换说明在.XML文件中使用 涉及: 将字符串筛选为所描述的字符或字符范围 “码码码>

从英语unicode到古吉拉特邦unicode有什么解决方案吗?
假设unicode表示a=\u0061,那么它将进行转换અ = u0095

Unicode CLDR提供了包含如何将拉丁语音译为古吉拉特语说明的文件。转换说明在.XML文件中使用

涉及:

  • 将字符串筛选为所描述的字符或字符范围

    “码码码><码码码><0.0-0-9码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码码本月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月月日日日日日日日日日日日月月月月月月月月月月月月月月月月日日日日日日日日日日日日日日日日日日日日日日日月月月月月月月月月月月月月月月月月月月月月月日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日}-ӣ-ӯḀ-ẙẠ-ỹἁἃ-ἅἇἉἋ-ἍἏἑἓ-ἕἙἛ-Ἕἡἣ-ἥἧἩἫ-ἭἯἱἳ-ἵἷἹἻ-ἽἿὁὃ-ὅὉὋ-Ὅὑὓ-ὕὗὙὛὝὟὡὣ-ὥὧὩὫ-ὭὯάέήίόύώᾁᾃ-ᾅᾇᾉᾋ-ᾍᾏᾑᾓ-ᾕᾗᾙᾛ-ᾝᾟᾡᾣ-ᾥᾧᾩᾫ-ᾭᾯ-ᾱᾴᾸ-ᾹΆῄΈΉ῎ῐ-ῑΐῘ-ῙΊ῞ῠ-ῡΰῥῨ-ῩΎ-Ῥ΅ῴΌΏK-Å\uE04D\uE064]

  • 将上一步的结果放入

  • 将上一步的结果小写

  • 对上一步的结果执行变换。正如您从文件中看到的,这已经得到了很好的编译,我不打算详细介绍这一步

  • 根据上一步的结果执行。与上一步相同的注释

  • 将上一步的结果放入

  • 因此,如果我们对字母
    “a”
    执行此操作,并直接跳到步骤4,该步骤描述了以下相关转换:

    $wa=\uE005
    a→$wa
    
    我们现在有
    “\uE005”
    。现在,第5步:

    \uE005→અ
    
    因此,我们以
    ,并且在步骤6中保持不变



    您可能想看看,但我不确定这些是否只是cldr维护人员的开发工具,实际上我不知道是否有人用java实现了这个库。

    音译意味着用另一个字母表中的一些字母替换字母,所以从编程的意义上讲,这是非常简单的字符串操作(逐个字符读取字符串,以表驱动方式输出字符)。根据音译方案的不同,可能会有一些复杂情况。但是,您会采用哪种方案,以及您认为有什么问题?字符代码U+0095是错误的。显然,您想要的是U+0A85。其他字符应该如何翻译并不明显;您是否可以链接到规范、实现或其他一些示例安瓿?