Python正则表达式异常_Python_Regex

Python正则表达式异常

python regex

Python正则表达式异常,python,regex,Python,Regex,除了撇号之外，我如何对所有非字母数字字符进行拆分 re.split('\W+',text) 有效，但也将在撇号上拆分。如何在此规则中添加例外谢谢试试这个： re.split(r"[^\w']+",text) 注意w现在是小写，因为它表示所有字母数字字符（注意，其中包括下划线）。字符类[^\w']指的是任何不是（^）字母数字（\w）或撇号的字符。请尝试以下操作： re.split(r"[^\w']+",text) re.split(r"[^\w']+",text) 注意w现在是小写，因

除了撇号之外，我如何对所有非字母数字字符进行拆分

re.split('\W+',text)

有效，但也将在撇号上拆分。如何在此规则中添加例外

谢谢

试试这个：

re.split(r"[^\w']+",text)

注意

现在是小写，因为它表示所有字母数字字符（注意，其中包括下划线）。字符类

[^\w']

指的是任何不是（

）字母数字（

\w

）或撇号的字符。请尝试以下操作：

re.split(r"[^\w']+",text)

re.split(r"[^\w']+",text)

注意

现在是小写，因为它表示所有字母数字字符（注意，其中包括下划线）。字符类

[^\w']

指的是任何不是（

）字母数字（

\w

）或撇号的字符

re.split(r"[^\w']+",text)

通过使用

启动字符类，它会反转定义，因此

[^\w']

是

[\w']

的逆，它将匹配字母数字/下划线/撇号

re.split(r"[^\w']+",text)

通过使用

启动字符类，它会反转定义，因此

[^\w']

与

[\w']

相反，后者将匹配字母数字/下划线/撇号。

此处的答案不起作用，因为“引用”单词不会被去掉撇号

re.split(r"[^\w']+",text)

对我有效的是

re.split(r"\W'+|^'+|'+\W|'$|[^\w']+", text)

i、 e.删除：

非单词或后面的撇号行开始处的撇号或非单词或前的撇号

当前的解决方案这里的答案不起作用，因为“引用的”单词不会去掉撇号

对我有效的是

re.split(r"\W'+|^'+|'+\W|'$|[^\w']+", text)

i、 e.删除：

非单词或后面的撇号行开始处的撇号或非单词或前的撇号当前的解决方案