Unicode 给定的字符集涵盖哪些书写系统

Unicode 给定的字符集涵盖哪些书写系统,unicode,language-agnostic,Unicode,Language Agnostic,确定一组给定Unicode字符支持哪些书写系统(如in、拉丁语、希伯来语、阿拉伯语、片假名、中文字符)的最简单方法是什么?检查脚本和脚本扩展名集合中每个字符的属性,如中所述。检查集合中每个字符的脚本和脚本扩展名属性,如中所述。: Unicode字符被划分为称为 阻碍。其中许多块的名称源自 脚本名称,因为该脚本的字符主要是经过编码的 在那个街区。但是,块和脚本在以下方面有所不同 方式: 块只是范围,通常包含未分配的代码点 同一脚本中的字符可以编码在几个不同的块中 来自不同脚本的字符可以编码在同一

确定一组给定Unicode字符支持哪些书写系统(如in、拉丁语、希伯来语、阿拉伯语、片假名、中文字符)的最简单方法是什么?

检查
脚本
脚本扩展名
集合中每个字符的属性,如中所述。

检查集合中每个字符的
脚本和
脚本扩展名
属性,如中所述。

Unicode字符被划分为称为 阻碍。其中许多块的名称源自 脚本名称,因为该脚本的字符主要是经过编码的 在那个街区。但是,块和脚本在以下方面有所不同 方式:

  • 块只是范围,通常包含未分配的代码点
  • 同一脚本中的字符可以编码在几个不同的块中
  • 来自不同脚本的字符可以编码在同一块中
因此,使用块名作为脚本的简单替代 身份认同通常会导致糟糕的结果。例如,见附件A, Unicode技术标准18中的字符块

在后一个文档中,请优先注意中的写入系统和块。

Unicode字符被划分为称为 阻碍。其中许多块的名称源自 脚本名称,因为该脚本的字符主要是经过编码的 在那个街区。但是,块和脚本在以下方面有所不同 方式:

  • 块只是范围,通常包含未分配的代码点
  • 同一脚本中的字符可以编码在几个不同的块中
  • 来自不同脚本的字符可以编码在同一块中
因此,使用块名作为脚本的简单替代 身份认同通常会导致糟糕的结果。例如,见附件A, Unicode技术标准18中的字符块


在后一个文档中,请优先注意在中写入系统而不是块。

此时,我倾向于测试脚本中是否有足够的glyph出现在字符集中

该方法需要两个准备步骤:

  • 整合一套Unicode支持的书写系统(脚本)

  • 对于每个脚本,定义一个包含该脚本字符的字符集

  • 然后我可以通过测试“脚本X的字符集中是否有足够的字符同时也是字符集A的成员”来解决“字符集A是否支持脚本X”的问题。如果我对步骤(1)中的每个脚本都这样做,我会得到一个受支持脚本的列表


    提供的链接一二三 将Unicode字符映射到各自脚本的引用,这在步骤(1)和(2)中是非常宝贵的。

    此时,我倾向于测试脚本中是否有足够的字形出现在字符集中

    该方法需要两个准备步骤:

  • 整合一套Unicode支持的书写系统(脚本)

  • 对于每个脚本,定义一个包含该脚本字符的字符集

  • 然后我可以通过测试“脚本X的字符集中是否有足够的字符同时也是字符集A的成员”来解决“字符集A是否支持脚本X”的问题。如果我对步骤(1)中的每个脚本都这样做,我会得到一个受支持脚本的列表


    提供的链接一二三 引用一个将Unicode字符映射到各自脚本的方法,这在步骤(1)和(2)中是非常宝贵的。

    我想这是维基百科,或者我被误解了这个问题?@nick_Gabbe–编程。有任意字符集出现,必须为每个字符确定支持的书写系统。我猜这是维基百科,否则我被误解了这个问题?@nick_gabbe–编程方式。有任意字符集进入,并且必须为每个有用链接确定支持的写入系统。感谢有用链接。是的,知道块绝对是不够的。到目前为止,对单个角色进行检查似乎是不可避免的。是的,知道块绝对是不够的。到目前为止,对单个字符进行检查似乎是不可避免的。