有没有像Perl 5'这样的Java库;s文本::Unidecode?

有没有像Perl 5'这样的Java库;s文本::Unidecode?,java,perl,unicode,transliteration,Java,Perl,Unicode,Transliteration,Perl5在CPAN上有一个名为的模块,该模块将Unicode翻译成ASCII。因此,例如,如果您将字符串“”北亰 — 这是最好的“”它把字符串交还给“\”北京--这是最好的\。对Java库进行快速搜索以执行相同的操作时,只会找到将Unicode字符剥离或将重音字符转换为非重音字符的代码 有没有人知道有一个Java库可以生成与Text::Unidecode类似的输出?一个快速的Google说:-但是看起来它已经有一段时间没有更新了。还有一个Java库: 与Gradle一起使用: compile

Perl5在CPAN上有一个名为的模块,该模块将Unicode翻译成ASCII。因此,例如,如果您将字符串
“”北亰 — 这是最好的“”
它把字符串交还给
“\”北京--这是最好的\
。对Java库进行快速搜索以执行相同的操作时,只会找到将Unicode字符剥离或将重音字符转换为非重音字符的代码


有没有人知道有一个Java库可以生成与
Text::Unidecode
类似的输出?

一个快速的Google说:-但是看起来它已经有一段时间没有更新了。

还有一个Java库:

与Gradle一起使用:

compile 'cz.jirutka.unidecode:unidecode:1.0.1'
与Maven一起使用:

<dependency>
    <groupId>cz.jirutka.unidecode</groupId>
    <artifactId>unidecode</artifactId>
    <version>1.0.1</version>
</dependency>

cz.jirutka.unidecode
单解码
1.0.1

鉴于Perl 5版本自2001年以来一直没有改变,我怀疑它在运行后是否需要更新。对此我不确定。Java的Unicode支持在过去几年中经历了多次修改——我怀疑2010年的库是否能够支持现代平台的所有功能,我的理解是这是一个非常重要的问题。请注意,实现的算法过于简化,老实说,我无法想象这个“音译”库有什么合理的用途。要将使用非拉丁字符的文本音译为拉丁字符,您至少需要知道源语言和目标语言,可能需要使用哪种音译系统,在某些情况下甚至需要隐含的上下文知识,这使得自动翻译几乎不可能。无论是谁,投票决定结束这个问题,因为据称他要求“推荐工具、库或最喜欢的非现场资源”:这个问题不会引发固执己见的争论。它询问是否存在类似的库(基于事实),而不是最佳/最喜欢的库是什么(基于观点)。此问题应保持开放状态,以便提供备选库作为答案。@jarnbjo在两个数据库之间传输时,消息被损坏。损坏仅发生在非ASCII字符上。虽然正在调查损坏的修复方法,但希望消息可读。语言接近我们主要处理em破折号、卷曲引号之类的问题,但我想要一个更完整的权宜之计,而不仅仅是去掉那些冒犯的角色。