是否为1字节UTF-8“;顺序;你有特别的名字吗?
根据,在UTF-8中,多字节序列中的第一个字节称为前导字节,序列中的后续字节称为连续字节 我知道这些可能不是“官方”名称(事实上,没有为不同的八位字节类型提供任何名称),但根据维基百科和我到目前为止的研究,这些似乎是常用的名称 对于既不是前导字节也不是延续字节的字节(即,对于<128的代码点),是否有一个通用的特殊名称是否为1字节UTF-8“;顺序;你有特别的名字吗?,utf-8,Utf 8,根据,在UTF-8中,多字节序列中的第一个字节称为前导字节,序列中的后续字节称为连续字节 我知道这些可能不是“官方”名称(事实上,没有为不同的八位字节类型提供任何名称),但根据维基百科和我到目前为止的研究,这些似乎是常用的名称 对于既不是前导字节也不是延续字节的字节(即,对于
我正在记录一些相当复杂的代码,这些代码设计用于处理UTF-8编码的字符串,我想确保使用标准术语以避免混淆。有些人将UTF-8的前7位称为ASCII有些人将UTF-8的前7位称为ASCII在我希望看到定义的任何地方,我都找不到这方面的特殊术语(除了已经提到的ASCII). 我唯一能补充的是,一个字节的“序列”是一个合法的序列,并且一个字节不排除被称为前导字节 Unicode标准的参考:
- 代码单元序列可以由单个代码单元组成
- 为UTF-8代码单元序列的第一个或前导元素保留8位代码单元值的范围,并且为此类序列的后续或尾随元素保留8位代码单元值的完全分离范围
- 代码单元序列可以由单个代码单元组成
- 为UTF-8代码单元序列的第一个或前导元素保留8位代码单元值的范围,并且为此类序列的后续或尾随元素保留8位代码单元值的完全分离范围