如何确定繁体汉字语义变体的简化Unicode变体?

如何确定繁体汉字语义变体的简化Unicode变体?,unicode,cjk,Unicode,Cjk,如回答中所述,Unihan数据库指定传统字符是否具有简化变体(kSimplifiedVariant)。但是,有些字符具有语义变体(kSemanticVariant),而这些变体本身具有简化的变体。例如U+8216舖 有一个语义变体U+92EA鋪 这反过来又有一个简化的变体U+94FA铺. 传统到简化的映射是否应该将U+8216转换为U+94FA 如果是这样的话,鉴于Unihan数据库没有将U+94FA直接列为U+8216的K简化变量,仅列为中间形式U+92EA,生成或下载完整映射的最简单方法是什

如回答中所述,Unihan数据库指定传统字符是否具有简化变体(kSimplifiedVariant)。但是,有些字符具有语义变体(kSemanticVariant),而这些变体本身具有简化的变体。例如U+8216舖 有一个语义变体U+92EA鋪 这反过来又有一个简化的变体U+94FA铺.

  • 传统到简化的映射是否应该将U+8216转换为U+94FA
  • 如果是这样的话,鉴于Unihan数据库没有将U+94FA直接列为U+8216的K简化变量,仅列为中间形式U+92EA,生成或下载完整映射的最简单方法是什么

  • 第一个问题听起来离题,它与语言有关,实际上取决于你的应用程序逻辑,而不是与编程有关。