Unicode 就地转换机箱

Unicode 就地转换机箱,unicode,Unicode,假设我有一个包含unicode文本的抽象缓冲区,并且我想就地转换它的大小写。我能做到吗?或者,换句话说:unicode标准是否保证所有小写/大写字母对都用相同数量的代码单元表示 unicode标准是否保证所有小写/大写字母 字母对用相同数量的代码单位表示 否。以德语字母ß为例,它的大写表示法是SS,它的折叠式表示法是SSAFAIK,用于不区分大小写的匹配,唯一的保证是简单的大小写折叠可以用UTF-16字符串在适当的位置完成。难道ß没有大写表示法ẞ?@AndreiR。不,一会儿ẞ 确实被称为“拉丁

假设我有一个包含unicode文本的抽象缓冲区,并且我想就地转换它的大小写。我能做到吗?或者,换句话说:unicode标准是否保证所有小写/大写字母对都用相同数量的代码单元表示

unicode标准是否保证所有小写/大写字母 字母对用相同数量的代码单位表示


否。以德语字母
ß
为例,它的大写表示法是
SS
,它的折叠式表示法是
SS

AFAIK,用于不区分大小写的匹配,唯一的保证是简单的大小写折叠可以用UTF-16字符串在适当的位置完成。难道
ß
没有大写表示法
?@AndreiR。不,一会儿ẞ 确实被称为“拉丁文大写字母夏普S”,它在规范上不是ß的大写字母。原因之一是ẞ 极为罕见;对于一个德国人来说,如果你在一个普通的句子中有这样的句子,这看起来很奇怪。@daxim然而,这个问题是关于Unicode的,如果你使用Unicode规则来获取大写字母
ß
,你最终得到的是
SS
,而不是
当然,好的编程语言具有足够的可塑性来改变这个僵化的错误。(我不怪Unicode联盟,他们被骗了。)–这里还有一些字符以类似的方式扩展:
ẖẗẘẙẚὐὒὔὖᾀᾁᾂᾃᾄᾅᾆᾇᾈᾉᾊᾋᾌᾍᾎᾏᾐᾑᾒᾓᾔᾕᾖᾗᾘᾙᾚᾛᾜᾝᾞᾟᾠᾡᾢᾣᾤᾥᾦᾧᾨᾩᾪᾫᾬᾭᾮᾯᾲᾳᾴᾶᾷᾼῂῃῄῆῇῌῒΐῖῗῢΰῤῦῧῲῳῴῶῷῼfffiflffifflſtstﬓﬔﬕﬖﬗ