什么是unicode变体选择器

什么是unicode变体选择器,unicode,Unicode,我在想。unicode变体选择器U-FE00到U-FE0F的用途是什么 示例:︀︁︂︂Unicode标准谈到了这一点。这里有一点(我肯定有更新的版本;这是我第一次发现): Unicode字符可以由多种字形表示,如第2章“Unicode标准的一般结构”3.0版中所述。有时,在文本处理中需要限制或更改用于表示字符的字形集。通常,这些更改通过富文本文档中字体或样式的选择来表示。在特殊情况下,这种与正常外观范围的差异需要在纯文本上下文中的同一文档中并排表示,在纯文本上下文中,不可能或不方便交换格式化文本

我在想。unicode变体选择器U-FE00到U-FE0F的用途是什么


示例:
︀︁︂︂

Unicode标准谈到了这一点。这里有一点(我肯定有更新的版本;这是我第一次发现):

Unicode字符可以由多种字形表示,如第2章“Unicode标准的一般结构”3.0版中所述。有时,在文本处理中需要限制或更改用于表示字符的字形集。通常,这些更改通过富文本文档中字体或样式的选择来表示。在特殊情况下,这种与正常外观范围的差异需要在纯文本上下文中的同一文档中并排表示,在纯文本上下文中,不可能或不方便交换格式化文本。例如,在使用蒙古语脚本的语言中,有时为了特定的文本目的需要特定的变体范围的字形,而“通用”字形的范围被认为是不合适的。当字符具有基本相同的语义时,使用变体选择器

变体选择器提供了一种机制,用于指定对用于表示特定字符的标志符号集的限制。它们还提供了一种机制来指定变体,例如CJK表意文字和蒙古语,这些变体基本上具有相同的语义,但具有显著不同的字形范围。变体序列可以指定为Unicode标准的一部分,它总是由一个基本字符后跟变体选择器组成。该序列称为基本字符的变体。变体选择器仅影响基本字符*的外观,并且仅影响本标准中定义的变体序列。变体选择器不用作通用代码扩展机制

(继续…)

您可能还对(这次从6.0.0开始)感兴趣

变体选择器范围是在Unicode标准的3.2版中引入的,位于平面0(基本的多语言平面)中。可以在该范围内找到更多选择器

大多数Unicode字符可以由多种字形表示,在富文本中,可以通过选择特定字体或样式来指示特定字形。这种机制在纯文本中不可用,因此引入了变体选择器,作为指示应更改或限制适用于特定字符的字形的一种方式。基本字符后跟变体选择器,该组合称为变体序列。这不是通用机制,唯一允许的变化序列是文件中定义的变化序列,它构成Unicode字符数据库的一部分


你的猜测和我的一样好。。但是根据

我明白了

表情符号编码数据提示:在iOS 5/OSX 10.7中,苹果操作系统为该表情符号生成的底层代码已更改。iOS 7/OSX 10.9中对此表情符号生成的代码进行了轻微更改(添加了一个
变体选择器
),以便于在OSX和iOS中识别和显示此表情符号。我们不介意苹果,谢谢!我们只是喜欢我们的表情符号

他们的图表继续指出,这个“新的”,后10.9版本


与之前的1相比,具有
UTF-8字符计数
2。。。如果有帮助的话。

这不是问题的完整答案,但与表情符号和变体选择器有关:

❤ 字符(U+2764码点)是1993年的Unicode字符。
但是❤️ 表情符号实际上是❤ (U+2764)字符,后跟变体选择器-16(U+FE0F)


为什么?

专门谈论表情符号():

VS15和VS16被保留以确定是否为字符 应显示为表情符号。[…]
表情符号变体序列包含表情符号样式(带颜色)的VS16(U+FE0F)或文本样式(单色)的VS15(U+FE0E)

如果有一个字符(或符号、字形等)也打算作为表情符号,则
变体选择器-16
将指定渲染,以将其渲染为表情符号。但是如果同一个字符后面跟有
变量选择器-15
,它将指定渲染,以将其仅渲染为文本。如果未附加
变量选择器
,则默认表示形式将取决于Unicode的规范。对于表情符号,默认为表情符号。对于其他角色,如❤, 默认为文本

另一个例子来自

每个表情符号有两种变体:


U+FE0E(变体选择器-15)选择文本表示(例如@MikeKeskinov:恐怕不知道。@MikeKeskinov在2016年就被使用了。我在处理从社交媒体收集的数据时不断遇到这些糟糕的事情。我不得不在❤;之后添加️;,以获得红心表情符号,而不是黑色表情符号。网站更改了关于变体选择器的信息:“[添加了变体选择器]建议操作系统在可用时显示字符表情符号样式,而不是黑白文本。”他们还添加了两个链接:你的示例在哪里?