Unicode 以编程方式确定汉字的笔划数?

Unicode 以编程方式确定汉字的笔划数?,unicode,character-encoding,cjk,Unicode,Character Encoding,Cjk,Unicode是否存储有关中文、日文或其他基于笔划的字符的笔划计数信息?您的意思是,它是否以某种方式编码在实际的代码点中?不。你可以在网上找到(或创建一个)某个地方的某个表格,但存储这种元数据不是Unicode规定的一部分。谷歌搜索出了一个由发布的文件,其中包含多个文本文件,包括Unihan\u RadicalStrokeCounts.txt,这可能是你想要的。还有一个基于此数据的在线测试。如果您想进行字符识别,请使用goggle Hanzidct 还可以查看Unihan数据站点: 您可以查找

Unicode是否存储有关中文、日文或其他基于笔划的字符的笔划计数信息?

您的意思是,它是否以某种方式编码在实际的代码点中?不。你可以在网上找到(或创建一个)某个地方的某个表格,但存储这种元数据不是Unicode规定的一部分。

谷歌搜索出了一个由发布的文件,其中包含多个文本文件,包括
Unihan\u RadicalStrokeCounts.txt
,这可能是你想要的。还有一个基于此数据的在线测试。

如果您想进行字符识别,请使用goggle Hanzidct

还可以查看Unihan数据站点:


您可以查找笔划计数,然后获取角色信息。您可能可以构建自己的查找功能。

在Python中,有一个用于此功能的库:

>>> from cjklib.characterlookup import CharacterLookup
>>> cjk = CharacterLookup('C')
>>> cjk.getStrokeCount(u'日')
4

免责声明:我写的UILocalizedIndexedCollation可以是一个完整的解决方案

首先,调用“UILocalizedIndexedCollationSectionForObject:collationStringSelector:”获取节的索引。然后返回“UILocalizedIndexedCollation.sectionTitles”中检查此索引映射到的节