如何计算python数据框架中组合元素的频率

如何计算python数据框架中组合元素的频率,python,counting,Python,Counting,我有以下建议: 我想做的是计算单个元素的频率以及组合元素的频率。例如,在整个链表中,伞出现8次,洗涤剂出现5次,面包出现2次,等等。为此,我使用以下代码: # empty list freq = [] for i in data.columns: # count freq of each value per column m = data[i].value_counts().to_dict() # append frecuencies from each co

我有以下建议:

我想做的是计算单个元素的频率以及组合元素的频率。例如,在整个链表中,伞出现8次,洗涤剂出现5次,面包出现2次,等等。为此,我使用以下代码:

# empty list
freq = []
for i in data.columns:
    # count freq of each value per column
    m = data[i].value_counts().to_dict()
    
    # append frecuencies from each column in a single list
    freq.append(m)
    
counter = collections.Counter() 
# sum values with the same keys
for f in freq:  
    counter.update(f) 

result = dict(counter)
result
这是输出:

{'umbrella': 8,
 'detergent': 5,
 'bread': 2,
 'cheese': 3,
 'water': 6,
 'diaper': 3,
 'beer': 5,
 'milk': 2}
现在,下一步是计算组合元素的频率。例如:

  • {啤酒,尿布}在链接列表中出现2次
  • {雨伞、牛奶、啤酒}也会在链接列表中出现两次
我想做的是调整我的代码来执行组合元素的计数。有人知道怎么做吗?我非常感谢你的帮助。提前谢谢