Python正则表达式异常
除了撇号之外,我如何对所有非字母数字字符进行拆分Python正则表达式异常,python,regex,Python,Regex,除了撇号之外,我如何对所有非字母数字字符进行拆分 re.split('\W+',text) 有效,但也将在撇号上拆分。如何在此规则中添加例外 谢谢 试试这个: re.split(r"[^\w']+",text) 注意w现在是小写,因为它表示所有字母数字字符(注意,其中包括下划线)。字符类[^\w']指的是任何不是(^)字母数字(\w)或撇号的字符。请尝试以下操作: re.split(r"[^\w']+",text) re.split(r"[^\w']+",text) 注意w现在是小写,因
re.split('\W+',text)
有效,但也将在撇号上拆分。如何在此规则中添加例外
谢谢 试试这个:
re.split(r"[^\w']+",text)
注意w
现在是小写,因为它表示所有字母数字字符(注意,其中包括下划线)。字符类[^\w']
指的是任何不是(^
)字母数字(\w
)或撇号的字符。请尝试以下操作:
re.split(r"[^\w']+",text)
re.split(r"[^\w']+",text)
注意w
现在是小写,因为它表示所有字母数字字符(注意,其中包括下划线)。字符类[^\w']
指的是任何不是(^
)字母数字(\w
)或撇号的字符
re.split(r"[^\w']+",text)
通过使用^
启动字符类,它会反转定义,因此[^\w']
是[\w']
的逆,它将匹配字母数字/下划线/撇号
re.split(r"[^\w']+",text)
通过使用
^
启动字符类,它会反转定义,因此[^\w']
与[\w']
相反,后者将匹配字母数字/下划线/撇号。此处的答案不起作用,因为“引用”单词不会被去掉撇号
re.split(r"[^\w']+",text)
对我有效的是
re.split(r"\W'+|^'+|'+\W|'$|[^\w']+", text)
i、 e.删除:
非单词或后面的撇号
行开始处的撇号或
非单词或前的撇号
当前的解决方案这里的答案不起作用,因为“引用的”单词不会去掉撇号 对我有效的是
re.split(r"\W'+|^'+|'+\W|'$|[^\w']+", text)
i、 e.删除:
非单词或后面的撇号
行开始处的撇号或
非单词或前的撇号
当前的解决方案