Python 基于模式的变量结尾截断

Python 基于模式的变量结尾截断,python,regex,Python,Regex,我有一个URL列表,格式如“www.blah.com/en-us”,我需要删除“www.blah.com”之后的任何内容。我尝试使用以下方法: import re website = www.blah.com/en-us cleanURL = re.sub('(.|\n)*?com', "", website) 输出:“en us” 所以我得到了我想要的相反的结果。抱歉,如果这篇文章格式不正确,第一次提问 必须使用正则表达式吗?如果您试图处理的url中没有协议(例如http://),您可以使用

我有一个URL列表,格式如“www.blah.com/en-us”,我需要删除“www.blah.com”之后的任何内容。我尝试使用以下方法:

import re
website = www.blah.com/en-us
cleanURL = re.sub('(.|\n)*?com', "", website)
输出:“en us”


所以我得到了我想要的相反的结果。抱歉,如果这篇文章格式不正确,第一次提问

必须使用正则表达式吗?如果您试图处理的url中没有协议(例如http://),您可以使用
您的url字符串。split('/',1)[0]
它应该在'/'的第一个实例上进行拆分,并在拆分之前为您提供部分。

是否使用regex a must?如果您试图处理的url中没有协议(例如http://),您可以使用
您的url字符串。split('/',1)[0]
,它应该在'/'的第一个实例上进行拆分,并在拆分之前为您提供部分。

website = "www.blah.com/en-us"
cleanURL = website.split("/",1)[0]

使用

website = "www.blah.com/en-us"
cleanURL = website.split("/",1)[0]

奇怪的是,当我运行您的代码时,我没有得到
en-us
,我得到
name错误:名称“www”未定义
。你确定这就是你正在运行的代码吗?可能是Strange的副本,当我运行你的代码时,我没有得到
en us
,我得到
name错误:没有定义名称“www”
。你确定这就是你正在运行的代码吗?可能是你的副本,你不需要条件
“www.blah.com.split(“/”)=[“www.blah.com”]
您不需要条件<代码>“www.blah.com.split(“/”)=[“www.blah.com”]