Python 这是什么?

Python 这是什么?,python,Python,问题1)“?u”是否表示unicode?为什么会有一个问号 问题2):w+表示要匹配1个或多个单词。那么为什么还需要另一个“\w”呢?问题1:您是对的,它代表“Unicode”。(?)符号是使用regex标志的一种方法。这相当于re.compile(r'\b\w\w+\b',re.UNICODE) 问题2:正如@verandaguiy在评论中指出的,这将保证匹配中至少有2个单词字符\w{2,}相当于\w\w+。我不认为有任何理由使用后者,除非你想单独捕捉第一个角色。我想\w\w+实际上比\w{2

问题1)“?u”是否表示unicode?为什么会有一个问号


问题2):w+表示要匹配1个或多个单词。那么为什么还需要另一个“\w”呢?

问题1:您是对的,它代表“Unicode”。
(?)
符号是使用regex标志的一种方法。这相当于
re.compile(r'\b\w\w+\b',re.UNICODE)

问题2:正如@verandaguiy在评论中指出的,这将保证匹配中至少有2个单词字符
\w{2,}
相当于
\w\w+
。我不认为有任何理由使用后者,除非你想单独捕捉第一个角色。我想
\w\w+
实际上比
\w{2,}
少了一个字符,但在我看来它不那么优雅,也更令人困惑


用于编写和分析正则表达式

使用regexr.com了解RE正在做什么。对于问题2:因为您希望在输入数据中匹配2个或更多字母字符,并且出于任何原因,您希望避免使用
\w{2,}
符号。
"token_pattern": r"(?u)\b\w\w+\b",