获取Python中代码点的Unicode版本

获取Python中代码点的Unicode版本,python,unicode,Python,Unicode,我有一个小脚本打印一些unicode字符的调试信息。由于兼容性,我需要过滤掉Unicode 8.0附带的所有内容 #!/usr/bin/env python3 import unicodedata skip = [ 0x0001F643, # Unicode 8.0 0x0001F644, # Unicode 8.0 ] for n in range(0x0001F600, 0x0001F64F): if n in skip: continue

我有一个小脚本打印一些unicode字符的调试信息。由于兼容性,我需要过滤掉Unicode 8.0附带的所有内容

#!/usr/bin/env python3

import unicodedata

skip = [
    0x0001F643, # Unicode 8.0
    0x0001F644, # Unicode 8.0
]

for n in range(0x0001F600, 0x0001F64F):
    if n in skip:
        continue

    c = chr(n)
    name = unicodedata.name(c)
    print('{} U+{:5X} {}'.format(c, n, name))

是否有方法获取通过编程方式添加特定代码点的Unicode版本?

包含并提供了一些有关Unicode字符的属性信息,但不幸的是,这些信息不在其中。如果您想访问此信息,需要下载并解析UCD。

太好了,谢谢。该链接谈到unicode属性正则表达式,如
\p{age=3.0}
。我尝试使用regex模块来运行它。但是
print(regex.compile(r'[\p{age=8.0}]').match(“ö”))
给了我奇怪的编译错误。知道如何使用正则表达式吗?
re
不支持Unicode属性。支持某些Unicode属性,但不支持年龄。您需要直接使用UCD来获得您想要的。