Python Regex删除单词并查找单词
我想在一个句子中查找并删除https部分。 我使用Python Regex删除单词并查找单词,python,regex,Python,Regex,我想在一个句子中查找并删除https部分。 我使用re.search(“^https://t.co/.*[a-zA-Z]“,数据)` 结果是: match='https://xx.x/ekGSeJufuH 7 jalan indonesia yang pa match='https://xx.x/okbymT3g' 但我只想拿match='class2]https://xx.x/ekGSeJufuH和删除,同时保留单词的其余部分。我的正则表达式有问题吗?*匹配任何字符,包括空格 更简单的方法
re.search(“^https://t.co/.*[a-zA-Z]“
,数据)`
结果是:
match='https://xx.x/ekGSeJufuH 7 jalan indonesia yang pa
match='https://xx.x/okbymT3g'
但我只想拿
match='class2]https://xx.x/ekGSeJufuH
和删除,同时保留单词的其余部分。我的正则表达式有问题吗?*匹配任何字符,包括空格
更简单的方法是
我认为它是有效的,因为URL不允许内部有任何WS。据我所知,您只想从字符串中排除
“https://”
。如果是这样,这可能是您正在寻找的正则表达式:
r“https://(.*)”
将上述正则表达式与您提供的地址一起使用:
regex=re.compile(r“https://(.*))
>>>regex.search(“https://xx.x/ekGSeJufuH 7印尼雅兰集团(1)
'xx.x/ekGSeJufuH 7 jalan indonesia yang pa'
>>>regex.search(“https://xx.x/okbymT3g第二组(1)
'xx.x/okbymT3g'
如果我遗漏了正则表达式的更多标准,只需对我的答案进行注释,我将相应地更新正则表达式。我尝试稍微调整它,并用
re.search("^https://t.co/\S*",txt)
请给出一个完整的例子。您的代码应该足够多,其他人可以不经修改就运行它并看到问题所在。你应该明确地显示什么是输入,什么是输出,什么是你想要的输出。你可以不使用正则表达式,只找到第一个空格,然后保留所有内容。如果它工作,它就工作,但我不知道这个正则表达式如何匹配问题中提供的地址。