Python 根据模式删除重复的字符串

Python 根据模式删除重复的字符串,python,Python,我有一个URL列表,格式为http://WEBSITE.com/XXXXX/YYYYY其中X和Y是随机字符 我如何让Python只保留具有不同大小写不敏感值的结果?它是否保留YYYYY部分并不重要?查看rsplit(),然后使用集合。 rsplit用于通过分隔符(如“/”)拆分字符串,而set包含唯一的元素 -rsplit() -设置查看rsplit(),然后使用设置。 rsplit用于通过分隔符(如“/”)拆分字符串,而set包含唯一的元素 -rsplit() -设置好的,你可以很容易地刮去路

我有一个URL列表,格式为
http://WEBSITE.com/XXXXX/YYYYY
其中
X
Y
是随机字符

我如何让Python只保留具有不同大小写不敏感值的结果?它是否保留
YYYYY
部分并不重要?

查看
rsplit()
,然后使用
集合。
rsplit
用于通过分隔符(如“/”)拆分字符串,而
set
包含唯一的元素

-rsplit() -设置查看
rsplit()
,然后使用
设置。
rsplit
用于通过分隔符(如“/”)拆分字符串,而
set
包含唯一的元素

-rsplit()
-设置

好的,你可以很容易地刮去路径的最后一部分:

id = "/".join(url.split('/')[:-1]) # split, lose last item, rejoin
然后将您的ID放在
set()
上以保持其唯一性:

ids = set()
ids.add(id)

好吧,你可以很容易地剃掉道路的最后一部分:

id = "/".join(url.split('/')[:-1]) # split, lose last item, rejoin
然后将您的ID放在
set()
上以保持其唯一性:

ids = set()
ids.add(id)

使用集合理解:

values = { url.split("/")[3] for url in url_list }

使用集合理解:

values = { url.split("/")[3] for url in url_list }

如果您在*nix服务器上,您可以从python中剥离并执行sort-u listfile | uniq-ii如果您在*nix服务器上,您可以从python中剥离并执行sort-u listfile | uniq-i