Python正则表达式'\s'；与unicode BOM表不匹配（U+；FEFF）_Python_Regex_Unicode

Python正则表达式'\s'；与unicode BOM表不匹配（U+；FEFF）

python regex unicode

Python正则表达式'\s'；与unicode BOM表不匹配（U+；FEFF）,python,regex,unicode,Python,Regex,Unicode,Pythonre模块表示，当设置re.UNICODE标志时，'\s'将匹配：在Unicode字符属性数据库中分类为空格的内容据我所知，BOM（U+FEFF）是然而： re.match(u'\s', u'\ufeff', re.UNICODE) 计算结果为None 这是Python中的错误还是我遗漏了什么？U+FEFF不是unicode数据库中的空白字符维基百科只列出它是一个“相关字符”。这些字符类似于空白字符，但在数据库中没有WSpace属性如果unicodedata.categor

Python

re

模块表示，当设置

re.UNICODE

标志时，

'\s'

将匹配：

在Unicode字符属性数据库中分类为空格的内容

据我所知，BOM（U+FEFF）是

然而：

re.match(u'\s', u'\ufeff', re.UNICODE)

计算结果为

None

这是Python中的错误还是我遗漏了什么？

U+FEFF不是unicode数据库中的空白字符

维基百科只列出它是一个“相关字符”。这些字符类似于空白字符，但在数据库中没有

WSpace

属性

如果unicodedata.category（c）==“Cf”和c.isspace（）]）为零，则这些字符都不会与

\s

len（[c表示映射中的c（chr，range（sys.maxunicode+1）]匹配。