有人能给我解释一下下面的正则表达式(Python)代码吗?
join()和split()函数的用途是什么? 返回后的“”是什么意思有人能给我解释一下下面的正则表达式(Python)代码吗?,python,regex,python-3.x,Python,Regex,Python 3.x,join()和split()函数的用途是什么? 返回后的“”是什么意思 def clean_tweet(self, tweet): return ' '.join(re.sub("(@[A-Za-z0-9]+)|([^0-9A-Za-z \t])|(\w+:\/\/\S+)", " ", tweet).split()) 表示括号之间的第一个或第二个或第三个正则表达式 (...)|(...)|(...) 匹配“@”后跟任意系列的字母(大小)和数字。“+”表示此系列的最长可能匹配,至少
def clean_tweet(self, tweet):
return ' '.join(re.sub("(@[A-Za-z0-9]+)|([^0-9A-Za-z \t])|(\w+:\/\/\S+)", " ", tweet).split())
表示括号之间的第一个或第二个或第三个正则表达式
(...)|(...)|(...)
匹配“@”后跟任意系列的字母(大小)和数字。“+”表示此系列的最长可能匹配,至少匹配1
@[A-Za-z0-9]+
单个数字,不能是(^
内[]
)字母(大或小)、空格或制表符之一。只有一个字符
[^0-9A-Za-z \t]
\w+
表示字母的最长匹配(至少一个),后跟“:”,后跟//(需要转义/)。最后,\S
+匹配了最长的匹配,并且至少匹配了一个非空格字符。@如果没有,请更正,谢谢。
\w+:\/\/\S+