Java 从拉丁字符中删除重音符号(变音符号)以进行比较
我需要比较一些用拉丁字母和重音符号(变音符号)书写的欧洲地名。有很多中欧和东欧的名字是用重音符号写的,比如Java 从拉丁字符中删除重音符号(变音符号)以进行比较,java,string,diacritics,transliteration,Java,String,Diacritics,Transliteration,我需要比较一些用拉丁字母和重音符号(变音符号)书写的欧洲地名。有很多中欧和东欧的名字是用重音符号写的,比如ž和ü上的拉丁字符,但是有些人只是用普通的拉丁字符写名字,没有重音符号,比如z和u 我需要一种方法让我的系统识别,例如mškžilina与msk zilina相同,并且与使用的所有其他重音字符类似。有没有一个简单的方法可以做到这一点 你可以利用和来摆脱 用法示例: String text = "mšk žilina"; String normalized = removeDiacritica
ž
和ü
上的拉丁字符,但是有些人只是用普通的拉丁字符写名字,没有重音符号,比如z
和u
我需要一种方法让我的系统识别,例如mškžilina
与msk zilina
相同,并且与使用的所有其他重音字符类似。有没有一个简单的方法可以做到这一点 你可以利用和来摆脱
用法示例:
String text = "mšk žilina";
String normalized = removeDiacriticalMarks(text);
System.out.println(normalized); // msk zilina
你可能知道一个同样适用于objective C=)的文本标准化程序吗?我也有同样的问题
String text = "mšk žilina";
String normalized = removeDiacriticalMarks(text);
System.out.println(normalized); // msk zilina