Text 这个疯狂的德语字符组合代表的是什么?

Text 这个疯狂的德语字符组合代表的是什么?,text,encoding,diacritics,Text,Encoding,Diacritics,我只是在分析下面的内容 在那里可以找到文本 und wären damit auch 起初,“ä”看起来很好,但一旦我检查它,结果发现这不是常规的“ä”(表示为ascw 228),而是: ascw: 97, char: a ascw: 776, char: ¨ 我以前从未见过这样的“ä”代表 一个网站怎么会使用这种奇怪的字符组合?它的好处是什么 您在问题中没有提到的是使用的编码。很明显,这是一种基于Unicode的编码 在Unicode中,代码点U+0308(十进制为776)是最短的。在字

我只是在分析下面的内容

在那里可以找到文本

und wären damit auch
起初,“ä”看起来很好,但一旦我检查它,结果发现这不是常规的“ä”(表示为ascw 228),而是:

ascw: 97, char: a
ascw: 776, char: ¨
我以前从未见过这样的“ä”代表


一个网站怎么会使用这种奇怪的字符组合?它的好处是什么

您在问题中没有提到的是使用的编码。很明显,这是一种基于Unicode的编码

在Unicode中,代码点U+0308(十进制为776)是最短的。在字母
a
和分隔符之外,创建了德语字符
a

确实有两种方法可以用umlauts(本例中为ä)表示德语字符。作为单个代码点:

U+00E4 latin small letter A with diaeresis
或作为两个代码点的序列:

U+0041 latin small letter A
U+0308 combining diaeresis
在大多数情况下,Unicode使用两个代码点,因为它需要更少的代码点来启用具有变音符号的大范围字符。然而,由于历史原因,带有德国元音和法国口音的字母有一个特殊的代码点

Unicode库是最重要的,大多数编程语言提供函数来规范化字符串,即,如果可能,将所有序列转换为单个代码点,或者将所有单个代码点扩展为两个代码点序列。另请参见。

那么大写字母“A”后跟U+0308将是“Ä”,对吗?