PHP htmlspecialchars函数中的Unicode替换字符
在htmlspecialchars函数中,如果设置ENT_替换标志,则应替换一些无效字符PHP htmlspecialchars函数中的Unicode替换字符,php,htmlspecialchars,html-sanitizing,Php,Htmlspecialchars,Html Sanitizing,在htmlspecialchars函数中,如果设置ENT_替换标志,则应替换一些无效字符 哪些字符被替换?无效字符和用于替换它的字符之间的映射是什么?只有一个通用替换字符:U+FFFD。如果您要写出UTF-8,那么这个代码点是适当编码的。如果不是,则获得相应的字符引用取而代之 不存在可逆映射。根据定义,原始字节序列无效,即它没有值(valid=有值) 被替换的字节(不是真正的“字符”)是在假定的源编码中无效的字节。例如,如果您的源代码是UTF-16,并且您有一个单独的代理,那么这将是
哪些字符被替换?无效字符和用于替换它的字符之间的映射是什么?只有一个通用替换字符:U+FFFD。如果您要写出UTF-8,那么这个代码点是适当编码的。如果不是,则获得相应的字符引用
代码>取而代之
不存在可逆映射。根据定义,原始字节序列无效,即它没有值(valid=有值)
被替换的字节(不是真正的“字符”)是在假定的源编码中无效的字节。例如,如果您的源代码是UTF-16,并且您有一个单独的代理,那么这将是“无效的”(尽管从技术上讲,任何文本处理器都应该在这种情况下终止)。更好的例子是,如果源编码是ASCII,那么高于127的任何值都是无效字符