Python正则表达式'\s';与unicode BOM表不匹配(U+;FEFF)
PythonPython正则表达式'\s';与unicode BOM表不匹配(U+;FEFF),python,regex,unicode,Python,Regex,Unicode,Pythonre模块表示,当设置re.UNICODE标志时,'\s'将匹配: 在Unicode字符属性数据库中分类为空格的内容 据我所知,BOM(U+FEFF)是 然而: re.match(u'\s', u'\ufeff', re.UNICODE) 计算结果为None 这是Python中的错误还是我遗漏了什么?U+FEFF不是unicode数据库中的空白字符 维基百科只列出它是一个“相关字符”。这些字符类似于空白字符,但在数据库中没有WSpace属性 如果unicodedata.categor
re
模块表示,当设置re.UNICODE
标志时,'\s'
将匹配:
在Unicode字符属性数据库中分类为空格的内容
据我所知,BOM(U+FEFF)是
然而:
re.match(u'\s', u'\ufeff', re.UNICODE)
计算结果为None
这是Python中的错误还是我遗漏了什么?U+FEFF不是unicode数据库中的空白字符 维基百科只列出它是一个“相关字符”。这些字符类似于空白字符,但在数据库中没有
WSpace
属性
如果unicodedata.category(c)==“Cf”和c.isspace()])为零,则这些字符都不会与\s
len([c表示映射中的c(chr,range(sys.maxunicode+1)]匹配。