正则表达式使用python从URL提取类别/子类别_Python_Regex_Url_Categories

正则表达式使用python从URL提取类别/子类别

python regex url

正则表达式使用python从URL提取类别/子类别,python,regex,url,categories,Python,Regex,Url,Categories,我需要解析表单的URL： www.my-journal.com/category/sub-category/sub-sub-category/title www.my-journal.com/category/sub-category/sub-sub-category www.my-journal.com/category/sub-category/ www.my-journal.com/category/ www.my-journal.com 更改类别、子类别和子类别当类别、子类别和子类别

我需要解析表单的URL：

www.my-journal.com/category/sub-category/sub-sub-category/title
www.my-journal.com/category/sub-category/sub-sub-category
www.my-journal.com/category/sub-category/
www.my-journal.com/category/
www.my-journal.com

更改类别、子类别和子类别

当类别、子类别和子类别存在时，我可以使用什么正则表达式来提取它们？有没有更好的方法来使用这些变量

>>> txt = 'www.my-journal.com/category/sub-category/sub-sub-category/title'
>>> re.findall(r'/[^/]*', txt)
['/category', '/sub-category', '/sub-sub-category', '/title']

如果最多只有3个级别，则可能：

>>> iter = re.finditer(r'/([^/]*)', txt)
>>> for _, m in zip(range(3), iter):
...     print(m.group(1))
... 
category
sub-category
sub-sub-category

如果最多只有3个级别，则可能：

>>> iter = re.finditer(r'/([^/]*)', txt)
>>> for _, m in zip(range(3), iter):
...     print(m.group(1))
... 
category
sub-category
sub-sub-category

为什么不在

categories = url.split('/')[1:]

为什么不在

categories = url.split('/')[1:]