Unicode CJK字符元素的重复代码点?

Unicode CJK字符元素的重复代码点?,unicode,cjk,Unicode,Cjk,Unicode具有CJK字符元素的代码点(有时称为“部首”,尽管与214个canonical/Kangxi部首不同) 其中一些存在于两个地方,作为两个不同的代码点。它们在我能看到的字体中看起来相同或几乎相同。怎么会?那里有什么历史 例如: U+4E5A乚 和U+2E83⺃ U+20628奇怪,在上搜索时,左列上的所有字符都给我“…不是有效的unicode字符”。仰望天空也不会给那些人起名字。我在数据库中也找不到它们,据说该块只有2个指定的代码点,维基百科认为这是合法的:在UnicodeData

Unicode具有CJK字符元素的代码点(有时称为“部首”,尽管与214个canonical/Kangxi部首不同)

其中一些存在于两个地方,作为两个不同的代码点。它们在我能看到的字体中看起来相同或几乎相同。怎么会?那里有什么历史

例如:

  • U+4E5A乚 和U+2E83⺃
  • U+20628奇怪,在上搜索时,左列上的所有字符都给我“…不是有效的unicode字符”。仰望天空也不会给那些人起名字。我在数据库中也找不到它们,据说该块只有2个指定的代码点,维基百科认为这是合法的:在UnicodeData.txt中,4E00和9FEF之间有一个间隙。顺便说一句,这正是CJK的范围。它们可以在Unicode联盟本身的网站上找到,当然,比如说U+5202是“刀;根号18”。UnicodeData.txt中没有统一表意文字范围的原因是它会使UnicodeData.txt大得多,而且这些字符的数据都是相同的,除了名称。奇怪的是,左列的所有字符在搜索时都会给我“…不是有效的unicode字符”。仰望天空也不会给那些人起名字。我在数据库中也找不到它们,据说该块只有2个指定的代码点,维基百科认为这是合法的:在UnicodeData.txt中,4E00和9FEF之间有一个间隙。顺便说一句,这正是CJK的范围。它们可以在Unicode联盟本身的网站上找到,当然,比如说U+5202是“刀;根号18”。UnicodeData.txt中没有统一的表意文字范围的原因是它会使UnicodeData.txt变得更大,而且这些字符的数据除了名称之外都是相同的。