Javascript ES6 String.prototype.normalize与W3C规范化
我知道ES6将有一个新函数,用于对字符串进行utf-8规范化(例如使用“NFC”形式) 在阅读中,我看到了以下常见问题: 问:W3C规范化和Unicode之间有什么区别 正常化 答:Unicode标准化有4种风格:C、D、KC和KD。它是C 这与W3C规范化相关。W3C规范化还处理 字符引用(nnnn;)等同于字符。对于 例如,文本字符串“annnn;”(其中nnnn=“0301”)是 Unicode标准化,因为它只包含ASCII字符,但 不是W3C规范化的,因为它包含 将尖锐重音与“a”结合起来,并以规范化形式C表示 应已标准化为U+00E1 这是否意味着我们需要替换所有出现的nnnn;在调用normalize('nfc')之前,使用它们的utf8等价物Javascript ES6 String.prototype.normalize与W3C规范化,javascript,unicode,utf-8,normalization,unicode-normalization,Javascript,Unicode,Utf 8,Normalization,Unicode Normalization,我知道ES6将有一个新函数,用于对字符串进行utf-8规范化(例如使用“NFC”形式) 在阅读中,我看到了以下常见问题: 问:W3C规范化和Unicode之间有什么区别 正常化 答:Unicode标准化有4种风格:C、D、KC和KD。它是C 这与W3C规范化相关。W3C规范化还处理 字符引用(nnnn;)等同于字符。对于 例如,文本字符串“annnn;”(其中nnnn=“0301”)是 Unicode标准化,因为它只包含ASCII字符,但 不是W3C规范化的,因为它包含 将尖锐重音与“
或将有某种规范化(“W3C”),这将有助于考虑通过ASCII“& x xnnnN”与一个重音相结合的字母,当您的JavaScript执行…如果你处理DOM,它已经消失了。 你唯一能看到这一点的是,如果你下载了html。 而且,无论如何,转换&。。。;对于正确的字符是不转义的,而不是规范化的。 所以你必须取消逃逸,然后正常化