Unicode联盟是否打算让UTF-16用完字符？_Unicode_Utf 8_Utf 16

Unicode联盟是否打算让UTF-16用完字符？

unicode utf-8

Unicode联盟是否打算让UTF-16用完字符？,unicode,utf-8,utf-16,Unicode,Utf 8,Utf 16,当前版本的UTF-16只能编码1112064个不同的数字（代码点）0x0-0x10FFFF Unicode联盟是否打算让UTF-16用完字符 i、 e.制作一个代码点>0x10FFFF 如果不是，为什么有人要为utf-8解析器编写能够接受5或6字节序列的代码？因为这会给它们的功能增加不必要的指令 1112064还不够，我们真的需要更多的字符吗？我的意思是：我们有多快就用完了？目前，Unicode标准没有定义任何超过U+10FFFF的字符，因此您可以编写应用程序代码，拒绝超过该点的字符预测未来是

当前版本的UTF-16只能编码1112064个不同的数字（代码点）<代码>0x0-0x10FFFF

Unicode联盟是否打算让UTF-16用完字符

i、 e.制作一个代码点>

0x10FFFF

如果不是，为什么有人要为utf-8解析器编写能够接受5或6字节序列的代码？因为这会给它们的功能增加不必要的指令

1112064还不够，我们真的需要更多的字符吗？我的意思是：我们有多快就用完了？

目前，Unicode标准没有定义任何超过U+10FFFF的字符，因此您可以编写应用程序代码，拒绝超过该点的字符

预测未来是困难的，但我认为你在短期内使用这种策略是安全的。老实说，即使Unicode在遥远的将来扩展到U+10FFFF之后，它几乎肯定不会用于任务关键型标志符号。您的应用程序可能与2063年推出的新Ferengi字体不兼容，但在实际出现问题时，您始终可以修复它。

没有理由编写支持5-6字节序列的UTF-8解析器，除非支持任何实际使用它们的旧系统。当前的官方UTF-8规范不支持5-6字节序列，以适应与UTF-16之间100%的低损耗转换。如果有一段时间Unicode必须支持高于

U+10FFFF

的新代码点，那么就有足够的时间为更高的位计数设计新的编码格式。或者，到那时，内存和计算能力就足够了，每个人都可以使用UTF-32来处理任何事情，它最多可以处理40多亿个字符。

为超过860000个未使用的字符留出空间；足够（约10000个字符）和85套以上，就像它；因此，在与客户接触的情况下，我们应该做好准备

2003年11月，限制UTF-8以U+10FFFF结尾，以匹配UTF-16字符编码的约束：UTF-8解析器不应接受会溢出UTF-16集的5或6字节序列，或4字节序列中大于

0x10FFFF

如果编辑列表集的大小超过（~10000个字符）的1/3，请将对unicode代码点限制的大小构成威胁的编辑列表集放在此处：

（约10000查尔）
（约5000查尔）

utf8 loose