不具有相同NFD和NFC编码的unicode字符集

不具有相同NFD和NFC编码的unicode字符集,unicode,Unicode,哪些unicode字符集不共享相同的NFC和NFD编码 比如说日本, 在NFD和NFC中都是u'\u65e5\u672c' 然而のご賛同をいただき ました 在NFD中:u'\u306e\u3053\u3099\u8cdb\u540c\u3092\u3044\u305f\u305f\u3099\u304d\u307e\u3057\u305f' 在NFC中:u'\u306e\u3054\u8cdb\u540c\u3092\u3044\u305f\u3060\u304d\u307e\u3057\

哪些unicode字符集不共享相同的NFC和NFD编码

比如说日本, 在NFD和NFC中都是u'\u65e5\u672c'

然而のご賛同をいただき ました

在NFD中:u'\u306e\u3053\u3099\u8cdb\u540c\u3092\u3044\u305f\u305f\u3099\u304d\u307e\u3057\u305f'

在NFC中:u'\u306e\u3054\u8cdb\u540c\u3092\u3044\u305f\u3060\u304d\u307e\u3057\u305f'


(NFD和NFC的定义:)

NFC是通过首先分解字符串,然后重新组合一些字符序列来执行的。因此,NFC和NFD结果不同的单个字符集是在UCD中具有分解映射的每个字符,而不是。这些字符也称为


请注意,这仅适用于单个字符。如果你考虑多个字符的序列,事情会变得复杂得多。例如,一个由两个字符组成的序列,如果NFC和NFD形式在单独应用时是相同的,那么当应用于整个序列时,可能会有不同的形式。

我添加了一个维基百科链接,解释NFD和NFC是什么。请随意替换为更好的参考。您在第二段中提到的关于组合字符重新排序的例外情况是什么?或者还有其他例外吗?@AdrianMcCarthy例外是关于组合字符的重新排序和组合。