Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/18.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用于URL隔离的Python帮助_Python_Python 3.x - Fatal编程技术网

用于URL隔离的Python帮助

用于URL隔离的Python帮助,python,python-3.x,Python,Python 3.x,如果我有一个URL www.somewebsite/category/category-xyz,并且我想将所有此类类别的URL从我已有的URL列表中分离出来,那么如何在Python中实现这一点呢 如果您注意到上面的URL解析将处理您不关心的事情,使字符串处理更容易。在上面的示例中,您可以看到它清楚地分解了协议、主机和端口,只剩下操作的路径。此外,如果有任何额外的查询参数,它也会打破这些 一旦有了路径字符串,就可以像解析任何字符串一样简单地解析它。因为你的路径总是以a/开头,你可以从你的字符串分割

如果我有一个URL www.somewebsite/category/category-xyz,并且我想将所有此类类别的URL从我已有的URL列表中分离出来,那么如何在Python中实现这一点呢

如果您注意到上面的URL解析将处理您不关心的事情,使字符串处理更容易。在上面的示例中,您可以看到它清楚地分解了协议、主机和端口,只剩下操作的路径。此外,如果有任何额外的查询参数,它也会打破这些

一旦有了路径字符串,就可以像解析任何字符串一样简单地解析它。因为你的路径总是以a/开头,你可以从你的字符串分割中忽略它

>>> parsed.path.split("/")[1:]
['cat1', 'cat2']

请注意;如果您的URL不包含路径,则可能会失败。如果你需要更多的细节,你应该提供你在问题中寻找的最终结果

我没有得到最后一行。为什么第一个位置有一个空白项?请解释一下?拆分只是内置的字符串拆分方法。它只是将/作为输入,并相应地分解字符串的其余部分。由于字符串以a/开头,它将第一个条目创建为空字符串。URL解析将其余信息分解,只需获得感兴趣的路径位,然后您就可以像普通字符串一样对其进行操作。
>>> parsed.path.split("/")[1:]
['cat1', 'cat2']