Regex 正则表达式-在Python中指定高Unicode代码点

Regex 正则表达式-在Python中指定高Unicode代码点,regex,python-unicode,Regex,Python Unicode,在Python 3.3中,在正则表达式中使用Unicode代码点范围没有问题: >>重新导入 >>>删除=“[\u0020-\u0090\ufb00-\uffff]” >>>s=‘abcdABCD’ﺉ﹅ffl你我他 \u仅支持16位代码点。您需要使用32位版本,\U。请注意,它需要8位数字,因此必须预先加上几个0(例如\U00010D2B) 来源:\u仅支持16位代码点。您需要使用32位版本,\U。请注意,它需要8位数字,因此必须预先加上几个0(例如\U00010D2B) 资料来源:

在Python 3.3中,在正则表达式中使用Unicode代码点范围没有问题:

>>重新导入
>>>删除=“[\u0020-\u0090\ufb00-\uffff]”

>>>s=‘abcdABCD’ﺉ﹅ffl你我他
\u
仅支持16位代码点。您需要使用32位版本,
\U
。请注意,它需要8位数字,因此必须预先加上几个0(例如
\U00010D2B


来源:

\u
仅支持16位代码点。您需要使用32位版本,
\U
。请注意,它需要8位数字,因此必须预先加上几个0(例如
\U00010D2B

资料来源: