Python正则表达式'\s';与unicode BOM表不匹配(U+;FEFF)

Python正则表达式'\s';与unicode BOM表不匹配(U+;FEFF),python,regex,unicode,Python,Regex,Unicode,Pythonre模块表示,当设置re.UNICODE标志时,'\s'将匹配: 在Unicode字符属性数据库中分类为空格的内容 据我所知,BOM(U+FEFF)是 然而: re.match(u'\s', u'\ufeff', re.UNICODE) 计算结果为None 这是Python中的错误还是我遗漏了什么?U+FEFF不是unicode数据库中的空白字符 维基百科只列出它是一个“相关字符”。这些字符类似于空白字符,但在数据库中没有WSpace属性 如果unicodedata.categor

Python
re
模块表示,当设置
re.UNICODE
标志时,
'\s'
将匹配:

在Unicode字符属性数据库中分类为空格的内容

据我所知,BOM(U+FEFF)是

然而:

re.match(u'\s', u'\ufeff', re.UNICODE)
计算结果为
None


这是Python中的错误还是我遗漏了什么?

U+FEFF不是unicode数据库中的空白字符

维基百科只列出它是一个“相关字符”。这些字符类似于空白字符,但在数据库中没有
WSpace
属性

如果unicodedata.category(c)==“Cf”和c.isspace()])为零,则这些字符都不会与
\s
len([c表示映射中的c(chr,range(sys.maxunicode+1)]匹配。