如何计算python数据框架中组合元素的频率
我有以下建议: 我想做的是计算单个元素的频率以及组合元素的频率。例如,在整个链表中,伞出现8次,洗涤剂出现5次,面包出现2次,等等。为此,我使用以下代码:如何计算python数据框架中组合元素的频率,python,counting,Python,Counting,我有以下建议: 我想做的是计算单个元素的频率以及组合元素的频率。例如,在整个链表中,伞出现8次,洗涤剂出现5次,面包出现2次,等等。为此,我使用以下代码: # empty list freq = [] for i in data.columns: # count freq of each value per column m = data[i].value_counts().to_dict() # append frecuencies from each co
# empty list
freq = []
for i in data.columns:
# count freq of each value per column
m = data[i].value_counts().to_dict()
# append frecuencies from each column in a single list
freq.append(m)
counter = collections.Counter()
# sum values with the same keys
for f in freq:
counter.update(f)
result = dict(counter)
result
这是输出:
{'umbrella': 8,
'detergent': 5,
'bread': 2,
'cheese': 3,
'water': 6,
'diaper': 3,
'beer': 5,
'milk': 2}
现在,下一步是计算组合元素的频率。例如:
- {啤酒,尿布}在链接列表中出现2次
- {雨伞、牛奶、啤酒}也会在链接列表中出现两次