Unicode 2字节重复

Unicode 2字节重复,unicode,char,duplicates,Unicode,Char,Duplicates,unicode字符是否可以有重复的字节“chunk” 例如: -------- 0xc3 | 0xa0 | 0xc2 | 0xa0 | <- SAME byte -------- -------- 0xc3 | 0xa0| 当然可以。只需查阅您最喜欢的Unicode数据库。例如,这里是 基本平面的大部分都被密集使用,因此您会发现大量的代码点,其值的形式为n×256+n。那么如何检查特定的unicode字符?我怎么知道炭有多大?原因unicode字符可以在1到4字节之间

unicode字符是否可以有重复的字节“chunk”

例如:

     --------
0xc3 | 0xa0 |
0xc2 | 0xa0 | <- SAME byte
     --------
--------
0xc3 | 0xa0|

当然可以。只需查阅您最喜欢的Unicode数据库。例如,这里是


基本平面的大部分都被密集使用,因此您会发现大量的代码点,其值的形式为n×256+n。

那么如何检查特定的unicode字符?我怎么知道炭有多大?原因unicode字符可以在1到4字节之间。@user2005038:这不正确。我建议您多了解一些与Unicode相关的知识。有一篇大家都在引用的著名文档,我相信很快就会有评论出现。@user2005038:Hmm,但我还没有读过,也不知道它是否有用。(不过我知道一些人对乔尔的看法。)你也可以咨询。@KerrekSB什么是假的?1-4字节的事情?凯特:哦,好吧,那么我将忽略注释:-)(因为它不相关)这似乎不是真正的问题,因为注释“那么我如何检查某个unicode字符?我如何知道字符有多大?”以及问题中的混乱。(Unicode字符没有“字节”。一个字符可以用不同的方式编码为字节,您似乎混淆了UTF-8和UTF-16。)请描述您试图解决的问题。
          ------------
          | 0xc2 0xa0 |
0xZZ 0xYY | 0xc2 0xa0 | <- SAME 2 bytes
          ------------