Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/472.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript ES6 String.prototype.normalize与W3C规范化_Javascript_Unicode_Utf 8_Normalization_Unicode Normalization - Fatal编程技术网

Javascript ES6 String.prototype.normalize与W3C规范化

Javascript ES6 String.prototype.normalize与W3C规范化,javascript,unicode,utf-8,normalization,unicode-normalization,Javascript,Unicode,Utf 8,Normalization,Unicode Normalization,我知道ES6将有一个新函数,用于对字符串进行utf-8规范化(例如使用“NFC”形式) 在阅读中,我看到了以下常见问题: 问:W3C规范化和Unicode之间有什么区别 正常化 答:Unicode标准化有4种风格:C、D、KC和KD。它是C 这与W3C规范化相关。W3C规范化还处理 字符引用(&#nnnn;)等同于字符。对于 例如,文本字符串“a&#xnnnn;”(其中nnnn=“0301”)是 Unicode标准化,因为它只包含ASCII字符,但 不是W3C规范化的,因为它包含 将尖锐重音与“

我知道ES6将有一个新函数,用于对字符串进行utf-8规范化(例如使用“NFC”形式)

在阅读中,我看到了以下常见问题:

问:W3C规范化和Unicode之间有什么区别 正常化

答:Unicode标准化有4种风格:C、D、KC和KD。它是C 这与W3C规范化相关。W3C规范化还处理 字符引用(&#nnnn;)等同于字符。对于 例如,文本字符串“a&#xnnnn;”(其中nnnn=“0301”)是 Unicode标准化,因为它只包含ASCII字符,但 不是W3C规范化的,因为它包含 将尖锐重音与“a”结合起来,并以规范化形式C表示 应已标准化为U+00E1

这是否意味着我们需要替换所有出现的&#xnnnn;在调用normalize('nfc')之前,使用它们的utf8等价物


或将有某种规范化(“W3C”),这将有助于考虑通过ASCII“& x xnnnN”与一个重音相结合的字母,当您的JavaScript执行…如果你处理DOM,它已经消失了。 你唯一能看到这一点的是,如果你下载了html。 而且,无论如何,转换&。。。;对于正确的字符是不转义的,而不是规范化的。 所以你必须取消逃逸,然后正常化