是否为1字节UTF-8“;顺序;你有特别的名字吗?

是否为1字节UTF-8“;顺序;你有特别的名字吗?,utf-8,Utf 8,根据,在UTF-8中,多字节序列中的第一个字节称为前导字节,序列中的后续字节称为连续字节 我知道这些可能不是“官方”名称(事实上,没有为不同的八位字节类型提供任何名称),但根据维基百科和我到目前为止的研究,这些似乎是常用的名称 对于既不是前导字节也不是延续字节的字节(即,对于

根据,在UTF-8中,多字节序列中的第一个字节称为前导字节,序列中的后续字节称为连续字节

我知道这些可能不是“官方”名称(事实上,没有为不同的八位字节类型提供任何名称),但根据维基百科和我到目前为止的研究,这些似乎是常用的名称

对于既不是前导字节也不是延续字节的字节(即,对于<128的代码点),是否有一个通用的特殊名称


我正在记录一些相当复杂的代码,这些代码设计用于处理UTF-8编码的字符串,我想确保使用标准术语以避免混淆。

有些人将UTF-8的前7位称为ASCII有些人将UTF-8的前7位称为ASCII

在我希望看到定义的任何地方,我都找不到这方面的特殊术语(除了已经提到的ASCII). 我唯一能补充的是,一个字节的“序列”是一个合法的序列,并且一个字节不排除被称为前导字节

Unicode标准的参考:

  • 代码单元序列可以由单个代码单元组成

  • 为UTF-8代码单元序列的第一个或前导元素保留8位代码单元值的范围,并且为此类序列的后续或尾随元素保留8位代码单元值的完全分离范围


无论我在哪里看到一个定义,我都找不到一个专门的术语(除了前面提到的ASCII之外)。我唯一能补充的是,一个字节的“序列”是一个合法的序列,并且一个字节不排除被称为前导字节

Unicode标准的参考:

  • 代码单元序列可以由单个代码单元组成

  • 为UTF-8代码单元序列的第一个或前导元素保留8位代码单元值的范围,并且为此类序列的后续或尾随元素保留8位代码单元值的完全分离范围


UTF-8 RFC甚至不使用前导字节或延续字节的名称。UTF-8 RFC甚至不使用前导字节或延续字节的名称。这如何回答问题?一个单字节序列叫什么?“ASCII字节”?“ASCII序列”?这应该是标准术语吗?一个字节序列是一个矛盾修饰法,除非你指的是位,但我很高兴让它过去。ASCII字符是UTF-8前7位字节的通用非官方术语。这回答了问题。这是如何回答问题的?一个单字节序列叫什么?“ASCII字节”?“ASCII序列”?这应该是标准术语吗?一个字节序列是一个矛盾修饰法,除非你指的是位,但我很高兴让它过去。ASCII字符是UTF-8前7位字节的通用非官方术语。这就回答了问题。