获取Python中代码点的Unicode版本_Python_Unicode

获取Python中代码点的Unicode版本

python unicode

获取Python中代码点的Unicode版本,python,unicode,Python,Unicode,我有一个小脚本打印一些unicode字符的调试信息。由于兼容性，我需要过滤掉Unicode 8.0附带的所有内容 #!/usr/bin/env python3 import unicodedata skip = [ 0x0001F643, # Unicode 8.0 0x0001F644, # Unicode 8.0 ] for n in range(0x0001F600, 0x0001F64F): if n in skip: continue

我有一个小脚本打印一些unicode字符的调试信息。由于兼容性，我需要过滤掉Unicode 8.0附带的所有内容

#!/usr/bin/env python3

import unicodedata

skip = [
    0x0001F643, # Unicode 8.0
    0x0001F644, # Unicode 8.0
]

for n in range(0x0001F600, 0x0001F64F):
    if n in skip:
        continue

    c = chr(n)
    name = unicodedata.name(c)
    print('{} U+{:5X} {}'.format(c, n, name))

是否有方法获取通过编程方式添加特定代码点的Unicode版本？

包含并提供了一些有关Unicode字符的属性信息，但不幸的是，这些信息不在其中。如果您想访问此信息，需要下载并解析UCD。

太好了，谢谢。该链接谈到unicode属性正则表达式，如

\p{age=3.0}

。我尝试使用regex模块来运行它。但是

print（regex.compile（r'[\p{age=8.0}]'）.match（“ö”））

给了我奇怪的编译错误。知道如何使用正则表达式吗？

re

不支持Unicode属性。支持某些Unicode属性，但不支持年龄。您需要直接使用UCD来获得您想要的。