正则表达式使用python从URL提取类别/子类别
我需要解析表单的URL:正则表达式使用python从URL提取类别/子类别,python,regex,url,categories,Python,Regex,Url,Categories,我需要解析表单的URL: www.my-journal.com/category/sub-category/sub-sub-category/title www.my-journal.com/category/sub-category/sub-sub-category www.my-journal.com/category/sub-category/ www.my-journal.com/category/ www.my-journal.com 更改类别、子类别和子类别 当类别、子类别和子类别
www.my-journal.com/category/sub-category/sub-sub-category/title
www.my-journal.com/category/sub-category/sub-sub-category
www.my-journal.com/category/sub-category/
www.my-journal.com/category/
www.my-journal.com
更改类别、子类别和子类别
当类别、子类别和子类别存在时,我可以使用什么正则表达式来提取它们?有没有更好的方法来使用这些变量
>>> txt = 'www.my-journal.com/category/sub-category/sub-sub-category/title'
>>> re.findall(r'/[^/]*', txt)
['/category', '/sub-category', '/sub-sub-category', '/title']
如果最多只有3个级别,则可能:
>>> iter = re.finditer(r'/([^/]*)', txt)
>>> for _, m in zip(range(3), iter):
... print(m.group(1))
...
category
sub-category
sub-sub-category
如果最多只有3个级别,则可能:
>>> iter = re.finditer(r'/([^/]*)', txt)
>>> for _, m in zip(range(3), iter):
... print(m.group(1))
...
category
sub-category
sub-sub-category
为什么不在
/
categories = url.split('/')[1:]
为什么不在
/
categories = url.split('/')[1:]