Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/list/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 用元组的元组中的项替换列表中的项_Python_List_Tuples - Fatal编程技术网

Python 用元组的元组中的项替换列表中的项

Python 用元组的元组中的项替换列表中的项,python,list,tuples,Python,List,Tuples,目前,我正在尝试统一rpm包中的许可证名称 因此,我解析RPM,以列表的形式获取许可证信息,并希望将这些列表与我构建的查找表进行比较 以下是一个例子: lic = ['GPLv2', ' & ', 'LGPLv2+', ' & ', 'LGPLv2.1+', ' | ', 'LGPLv3+'] duplicates = ( ('GPL-2.0', 'GPL-2', 'GPLv2', 'GPLv2.0'), ('GPL-2.0+',

目前,我正在尝试统一rpm包中的许可证名称

因此,我解析RPM,以列表的形式获取许可证信息,并希望将这些列表与我构建的查找表进行比较

以下是一个例子:

lic = ['GPLv2', ' & ', 'LGPLv2+', ' & ', 'LGPLv2.1+', ' | ', 'LGPLv3+']

duplicates = (
            ('GPL-2.0', 'GPL-2', 'GPLv2', 'GPLv2.0'),
            ('GPL-2.0+', 'GPL-2+', 'GPLv2+', 'GPLv2.0+'),
            ('GPL-3.0', 'GPL-3', 'GPLv3', 'GPLv3.0'),
            ('GPL-3.0+', 'GPL-3+', 'GPLv3+', 'GPLv3.0+'),
            ('LGPL-2.0', 'LGPLv2.0', 'LGPLv2', 'LGPL2'),
            ('LGPL-2.0+', 'LGPLv2.0+', 'LGPLv2+', 'LGPL2+'),
            ('LGPL-2.1', 'LGPLv2.1', 'LGPL2.1'),
            ('LGPL-2.1+', 'LGPLv2.1+', 'LGPL2.1+'),
            ('LGPL-3.0', 'LGPLv3.0', 'LGPLv3', 'LGPL3'),
            ('LGPL-3.0+', 'LGPLv3.0+', 'LGPLv3+', 'LGPL3+')
            )
用每个元组对应的第一个元素替换lic中重复出现的任何元素的最有效和最具python风格的方法是什么

例如:GPLv2需要用GPL-2.0替换,LGPLv2+需要用LGPL-2.0+替换,等等

我使用的是Python 3.5.2

我会首先将元组的duplicates元组修改为dict。像这样:

duplicates = {k: v for k, *v in duplicates}  # {'GPL-2.0': ['GPL-2', 'GPLv2', 'GPLv2.0'], ...}
然后做:

lic_clean = [next((k for k, v in duplicates.items() if x in v), x) for x in lic]
产生:

['GPL-2.0', ' & ', 'LGPL-2.0+', ' & ', 'LGPL-2.1+', ' | ', 'LGPL-3.0+']

您可以迭代您的lic并将其每个元素与重复的元素进行比较,如果找到匹配项,则将该元素替换为匹配元组的第一个元素

lic = ['GPLv2', ' & ', 'LGPLv2+', ' & ', 'LGPLv2.1+', ' | ', 'LGPLv3+']

duplicates = (
            ('GPL-2.0', 'GPL-2', 'GPLv2', 'GPLv2.0'),
            ('GPL-2.0+', 'GPL-2+', 'GPLv2+', 'GPLv2.0+'),
            ('GPL-3.0', 'GPL-3', 'GPLv3', 'GPLv3.0'),
            ('GPL-3.0+', 'GPL-3+', 'GPLv3+', 'GPLv3.0+'),
            ('LGPL-2.0', 'LGPLv2.0', 'LGPLv2', 'LGPL2'),
            ('LGPL-2.0+', 'LGPLv2.0+', 'LGPLv2+', 'LGPL2+'),
            ('LGPL-2.1', 'LGPLv2.1', 'LGPL2.1'),
            ('LGPL-2.1+', 'LGPLv2.1+', 'LGPL2.1+'),
            ('LGPL-3.0', 'LGPLv3.0', 'LGPLv3', 'LGPL3'),
            ('LGPL-3.0+', 'LGPLv3.0+', 'LGPLv3+', 'LGPL3+')
            )

for idx, i in enumerate(lic):
    for match in duplicates:
        if i in match:
            lic[idx] = match[0]
            break

print(lic)
输出:

['GPL-2.0', ' & ', 'LGPL-2.0+', ' & ', 'LGPL-2.1+', ' | ', 'LGPL-3.0+']

你可能需要用字典。谢谢。我想保留分隔符,以便以后可以重新组装原始许可证