如何在python中从unicode代码点转换为实际的unicode字符串?
我有一个包含unicode代码点列表的文件:如何在python中从unicode代码点转换为实际的unicode字符串?,python,unicode,Python,Unicode,我有一个包含unicode代码点列表的文件: 0x9C00 0x9D70 0x9D6B 0xFA2D 我正在尝试创建一个unicode字符数组,如下所示: with open("KANJI.TXT") as f: kanjiCodes = f.readlines() alphabet = [ code_point for code_point in kanjiCodes ] 如何将这些0x字符串转换为实际的unicode字符串?使用unichr print unichr(0
0x9C00
0x9D70
0x9D6B
0xFA2D
我正在尝试创建一个unicode字符数组,如下所示:
with open("KANJI.TXT") as f:
kanjiCodes = f.readlines()
alphabet = [
code_point for code_point in kanjiCodes
]
如何将这些0x字符串转换为实际的unicode字符串?使用unichr
print unichr(0x9C00)
在python 3.x中,可以执行以下操作:
kanjiCodes=['0x9C00', '0x9D70','0x9D6B', '0xFA2D']
print([chr(int(code_point, 16)) for code_point in kanjiCodes])
# ['鰀', '鵰', '鵫', '鶴']
这并没有解决主要问题,即字符代码已经表示为字符串。(另外,我应该提到我正在使用Python3,所以应该是chr(0x9C00))谢谢,这正是我想要的!