Python 查找具有公共元素的元组_Python_Set_Tuples

Python 查找具有公共元素的元组

python

Python 查找具有公共元素的元组,python,set,tuples,Python,Set,Tuples,假设我有一组有人名的元组。我想找到所有姓氏相同的人，不包括那些不与他人姓氏相同的人： # input names = set([('John', 'Lee'), ('Mary', 'Miller'), ('Paul', 'Ryan'), ('Bob', 'Ryan'), ('Tina', 'Lee'), ('Bob', 'Smith')]) # expected output {'Lee': ['Tina', 'John'], 'Ryan': ['Bob', 'Pa

假设我有一组有人名的元组。我想找到所有姓氏相同的人，不包括那些不与他人姓氏相同的人：

# input names = set([('John', 'Lee'), ('Mary', 'Miller'), ('Paul', 'Ryan'), ('Bob', 'Ryan'), ('Tina', 'Lee'), ('Bob', 'Smith')]) # expected output {'Lee': ['Tina', 'John'], 'Ryan': ['Bob', 'Paul']} # or similar
这就是我正在使用的

def find_family(names): result = {} try: while True: name = names.pop() if name[1] in result: result[name[1]].append(name[0]) else: result[name[1]] = [name[0]] except KeyError: pass return dict(filter(lambda x: len(x[1]) > 1, result.items()))
这看起来既丑陋又低效。有更好的方法吗？
可以用来简化代码：

from collections import defaultdict def find_family(names): d = defaultdict(list) for fn, ln in names: d[ln].append(fn) return dict((k,v) for (k,v) in d.items() if len(v)>1) names = set([('John', 'Lee'), ('Mary', 'Miller'), ('Paul', 'Ryan'), ('Bob', 'Ryan'), ('Tina', 'Lee'), ('Bob', 'Smith')]) print find_family(names)
这张照片是：

{'Lee': ['Tina', 'John'], 'Ryan': ['Bob', 'Paul']}
可用于简化代码：

from collections import defaultdict def find_family(names): d = defaultdict(list) for fn, ln in names: d[ln].append(fn) return dict((k,v) for (k,v) in d.items() if len(v)>1) names = set([('John', 'Lee'), ('Mary', 'Miller'), ('Paul', 'Ryan'), ('Bob', 'Ryan'), ('Tina', 'Lee'), ('Bob', 'Smith')]) print find_family(names)
这张照片是：

{'Lee': ['Tina', 'John'], 'Ryan': ['Bob', 'Paul']}

不要使用while循环，而是在集合内容上使用for循环（或类似的构造）（在执行时，可以对元组进行分解）：

您可能需要使用
defaultdict
或
orderedict
(http://docs.python.org/library/collections.html)要将数据保存在循环体中。
不要使用while循环，而是在设置的内容上使用for循环（或类似的构造）（同时，可以对元组进行分解）：

>>> names = set([('John', 'Lee'), ('Mary', 'Miller'), ('Paul', 'Ryan'), ... ('Bob', 'Ryan'), ('Tina', 'Lee'), ('Bob', 'Smith')])
您可能需要使用
defaultdict
或
orderedict
(http://docs.python.org/library/collections.html)将数据保存在循环体中

>>> names = set([('John', 'Lee'), ('Mary', 'Miller'), ('Paul', 'Ryan'), ... ('Bob', 'Ryan'), ('Tina', 'Lee'), ('Bob', 'Smith')])
使用for循环，您可以轻松地获得所有人的字典，其中键是他们的姓氏：

>>> families = {} >>> for name, lastname in names: ... families[lastname] = families.get(lastname, []) + [name] ... >>> families {'Miller': ['Mary'], 'Smith': ['Bob'], 'Lee': ['Tina', 'John'], 'Ryan': ['Bob', 'Paul']}
然后，您只需要使用条件
len（names）>1
过滤字典。可以使用“字典理解”完成此筛选：
使用for循环，您可以轻松地获得所有人的字典，其中键是他们的姓氏：

>>> families = {} >>> for name, lastname in names: ... families[lastname] = families.get(lastname, []) + [name] ... >>> families {'Miller': ['Mary'], 'Smith': ['Bob'], 'Lee': ['Tina', 'John'], 'Ryan': ['Bob', 'Paul']}
然后，您只需要使用条件
len（names）>1
过滤字典。可以使用“字典理解”完成此筛选：

@艾琳：我不会这么说，但这是一种你必须在弱智语言中使用的方法。@艾琳：我不会这么说，但这是一种你必须在弱智语言中使用的方法。