关于utf-8的几个问题

关于utf-8的几个问题,utf-8,Utf 8,我对UTF-8有一些问题 可以用UTF-8编码任何Unicode吗? utf-8是否允许仅使用1个字节对任何ascii字符进行编码? UTF-8编码的长度是固定的吗? 我的答案如下: 1不,不可能。可以对1114112个代码中的1112064进行编码 2是的 3不,问题1可能是1、2、3或4个字节,你说的任何Unicode是什么意思 你是说任何有效的unicode字符吗?那么是的 您是指从0x0到0x10FFFF的任何可能的字符值,包括不是有效unicode字符值的2048个代理代码点吗?然后是

我对UTF-8有一些问题

可以用UTF-8编码任何Unicode吗? utf-8是否允许仅使用1个字节对任何ascii字符进行编码? UTF-8编码的长度是固定的吗? 我的答案如下:

1不,不可能。可以对1114112个代码中的1112064进行编码

2是的


3不,问题1可能是1、2、3或4个字节,你说的任何Unicode是什么意思

你是说任何有效的unicode字符吗?那么是的

您是指从0x0到0x10FFFF的任何可能的字符值,包括不是有效unicode字符值的2048个代理代码点吗?然后是否,但这只是因为有效的UTF-8解码器应该拒绝这些值


UTF-8定义的方案完全能够独立地对这些代理值进行编码,事实上,编写UTF-8编码/解码软件更简单,只需像处理其他值一样处理这些值。

所有问题都得到了回答。我读了这篇文章,但我不确定我是否正确理解了它,尤其是第一个问题。如果有人能检查我更新的问题和我的答案,我将不胜感激。有人能帮忙吗?