日文、韩文和中文所需的Unicode字符

日文、韩文和中文所需的Unicode字符,unicode,fonts,multilingual,cjk,Unicode,Fonts,Multilingual,Cjk,我试图在没有获得语言学和早期人类历史学位的情况下回答这些基本问题,而这似乎是每一个谷歌搜索的领先方向 字体中需要包含哪些unicode字符 支持日文文本的呈现吗 字体中需要包含哪些unicode字符 支持中文文本的呈现吗 字体中需要包含哪些unicode字符 支持韩语文本的呈现吗 从@中的东亚脚本开始 例如,平假名是U+3040到U+309F,片假名是U+30A0到U+30FF。您可以通过查看相应的列表(特别是每个字符的“脚本”)来近似这些列表,但这并不能完全反映实际的字符使用情况 一个更好的指

我试图在没有获得语言学和早期人类历史学位的情况下回答这些基本问题,而这似乎是每一个谷歌搜索的领先方向

  • 字体中需要包含哪些unicode字符 支持日文文本的呈现吗

  • 字体中需要包含哪些unicode字符 支持中文文本的呈现吗

  • 字体中需要包含哪些unicode字符 支持韩语文本的呈现吗


  • 从@中的东亚脚本开始


    例如,平假名是U+3040到U+309F,片假名是U+30A0到U+30FF。

    您可以通过查看相应的列表(特别是每个字符的“脚本”)来近似这些列表,但这并不能完全反映实际的字符使用情况

    一个更好的指示器是已经为这些语言的字体定义的字符集(例如,
    Adobe-Japan-1-6
    Adobe-GB-1-5
    、以及
    Adobe-Korea1-2
    )。CMap文件应该允许您将它们转换回Unicode代码点。

    这取决于您希望为每种语言提供多少覆盖范围。所有这些语言中最常用的字符只需要几千个字符,但偶尔您会遇到一些超出范围的字符。随着系统支持的字符数的增加,在覆盖所有CJK字符之前,您不太可能遇到这些丢失的字符

    现代字体开发人员常用的一种方法是,为了节省制作字体的时间和精力,同时又能支持足够数量的字符以显示大多数字体,即使用在Unicode时代以前的字符集中给定的范围,如Big5(-HKSCS)、GB2312或18030,以及其他人的答案评论中提到的范围,但是,遇到不受支持的字符是很常见的

    在Unicode中,有一种被称为的东西被制作并定义了大约一万个字符,这些字符对于支持这些语言来说是最基本的,在Unicode数据库中,也有关于它们对于中国、日本、韩国等国家是否是最基本的信息,但是现在几乎没有人使用它们

    谷歌和Adobe现在正在制作Noto CJK或被称为源汉字的字体,该字体应该覆盖和示例一样多的CJK字符。但是,由于文件格式的限制,他们只能在字体中输入大约65535个字形,因此在制作过程中必须添加/删除字符


    最后,特别是对于韩国人来说,在很多情况下,只支持韩语/日语可能已经足够好了,因为汉字(表意文字)除了在专门领域之外,已经基本不用了。请注意,人名和标题中的某些单词可能是这些方面的一部分,它们仍然会使用汉字,因此这取决于它们对您是否重要。

    UTF-16将支持这些语言。许多方面,例如需要更好的纸张质量、字体大小,以及并非所有字体都具有相同的质量。最好联系本地机构。我建议查看为每个请求集设计的(Unicode之前的)代码页。微软的代码页932(Shift JIS/日文)、936(GB2312/简体中文)、949(EUC-KR/韩文)和950(Big5/繁体中文)将在字符级支持方面为您带来很大帮助。然而,从这些代码页到Unicode的映射是存在的:提问者应该进一步追求“支持”的想法:仅仅在字体中显示字符通常是不够的。