Python 查找具有重复值的字典键
我想返回dict的键,它们的值存在不止一次 有人能告诉我如何实现这一点吗Python 查找具有重复值的字典键,python,dictionary,Python,Dictionary,我想返回dict的键,它们的值存在不止一次 有人能告诉我如何实现这一点吗 some_dict = {"firstname": "Albert", "nickname": "Albert", "surname": "Likins", "username": "Angel"} 我将首先翻转键和值: a_list = [] for k,v in some_dict.iteritems(): if v in some_dict.values() and v != some_dict.keys
some_dict = {"firstname": "Albert", "nickname": "Albert", "surname": "Likins", "username": "Angel"}
我将首先翻转键和值:
a_list = []
for k,v in some_dict.iteritems():
if v in some_dict.values() and v != some_dict.keys(k):
a_list.append(k)
使用collections.defaultdict(set)
可以更有效地完成此操作。对于您的字典,翻转的
将如下所示:
flipped = {}
for key, value in d.items():
if value not in flipped:
flipped[value] = [key]
else:
flipped[value].append(key)
首先,将字典翻转成一个反向的multidict,将每个值映射到它映射到的所有键。像这样:
{
'Albert': ['nickname', 'firstname'],
'Angel': ['username'],
'Likins': ['surname']
}
现在,您只需在multidict中查找值大于1的键。这很简单:
>>> some_dict = {"firstname":"Albert","nickname":"Albert","surname":"Likins","username":"Angel"}
>>> rev_multidict = {}
>>> for key, value in some_dict.items():
... rev_multidict.setdefault(value, set()).add(key)
除multidict键外,其他键均为原始dict值。因此,这是每个重复值,而不是所有匹配每个重复值的键。但是你知道什么是所有匹配每个重复值的键吗
>>> [key for key, values in rev_multidict.items() if len(values) > 1]
['Albert']
当然,这会给你一个集合列表。如果您想将其扁平化为单个列表或集合,这很容易。您可以使用chain.from\u iterable
、嵌套理解或任何其他常用技巧。例如:
>>> [values for key, values in rev_multidict.items() if len(values) > 1]
[{'firstname', 'nickname'}]
此方法既不需要外部库,也不需要
if
语句:
>>> set(chain.from_iterable(values for key, values in rev_multidict.items() if len(values) > 1))
{'firstname', 'nickname'}
如果您的数据集不是太大,则不需要反向多指令集。您可以使用count on dict.values()并通过迭代dict.items()返回所需的键
希望这有帮助 此方法使用“try”和“for” 原始数据
desired_keys = []
vals = some_dict.values()
for key, value in some_dict.items():
if vals.count(value) > 1:
desired_keys.append(key)
代码
结果
reverse_dict = {}
for key, value in original_dict.items():
try:reverse_dict[value].append(key)
except:reverse_dict[value] = [key]
使用“defaultdict”:
你能自己尝试一下吗,哪怕是低效的尝试?这在概念上并不难。@Blender当然我有我的钥匙在这里。你能告诉我为什么你收集钥匙是成套的,而不仅仅是列表吗?毕竟,它们是唯一的。@StefanPochmann为什么不使用
集合
来处理一组没有意义顺序的固有唯一项呢?这正是它的目的。(取决于您以后对反向映射所做的操作,也可能有性能优势,但通常不会有;在这里使用它的主要原因是set
是表示集合的一种明显方式。)嗯,这一点很好。设置速度较慢,占用更多内存,请看(我想你知道,但我想至少自己看看数字)。我习惯于只在我真正需要它们的时候才使用它们。但我明白你的意思,并同意它们以“有意义”的方式更有意义。现在我还没决定我更喜欢什么。是的,我明白了。我表达得很糟糕。时间/记忆并不是真正直接的问题,更重要的是集合让我觉得更“强大”,而对我来说,它们的力量在这里被浪费了。我想我主要是用它们来修饰东西,或者建立交叉点,或者在检查中使用快速,所以不使用任何功能就使用它们似乎很奇怪。另外,我不喜欢写set()
:-)。但是就像我说的,我明白你的意思,我可以看到,在集合中有一个集合是很自然的,即使你不使用势能。对于这种情况,我可能会换成电视机。谢谢。@StefanPochmann:是的,set()
与(1,)
一起出现,语言上的一些“缺点”确实是Python的不幸之处,而不仅仅是抱怨的人不知道他在说什么的一个信号。嗯,明确地抓住KeyError会更好
original_dict = {"firstname":"Albert", "nickname":"Albert", "surname":"Likins", "username":"Angel"}
reverse_dict = {}
for key, value in original_dict.items():
try:reverse_dict[value].append(key)
except:reverse_dict[value] = [key]
>>> reverse_dict
{'Albert': ['firstname', 'nickname'], 'Likins': ['surname'], 'Angel': ['username']}
>>> [value for key, value in reverse_dict.items() if len(value) > 1]
[['firstname', 'nickname']]
from collections import defaultdict
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = defaultdict(list)
for k, v in s:
d[k].append(v)
for key, value in d.items():
if len(value) > 1:
print "key: %s has multiple values: %r" % (key, value)