Python 在df中查找列组合的计数
我有一张桌子Python 在df中查找列组合的计数,python,python-2.7,python-3.x,pandas,Python,Python 2.7,Python 3.x,Pandas,我有一张桌子 product_id_x product_id_y 1 2 1 3 1 4 3 7 3 11 3 14 3 2 and so on around (1000 rows) 我想找到每个产品的组合计数 即1具有1-2,1-3,1-4的组合(总共3个组合) 类似地,3总共有4个组合 并创建一个具有 pr
product_id_x product_id_y
1 2
1 3
1 4
3 7
3 11
3 14
3 2
and so on around (1000 rows)
我想找到每个产品的组合计数
即1具有1-2,1-3,1-4的组合(总共3个组合)
类似地,3总共有4个组合
并创建一个具有
product_id_x combinations
1 3
3 4
and so on ..(distinct product_id_x's)
我应该采取什么方法?
我的python技能处于初级水平。
提前感谢。您可以在产品id\u x
栏中使用:
df2 = df.groupby(['product_id_x']).agg(['count'])
或者,您可以直接在组上使用size
函数来获取每个组的大小:
df2 = df.groupby(['product_id_x']).size()
您可以在product\u id\u x
列上使用:
df2 = df.groupby(['product_id_x']).agg(['count'])
或者,您可以直接在组上使用size
函数来获取每个组的大小:
df2 = df.groupby(['product_id_x']).size()
size
统计每个列值对同时出现的行数count
对同一事物进行计数,但不为空。由于您没有提到任何有关空值的内容,因此我将在groupby
之后使用size
,然后使用unstack
df.groupby(['product_id_x', 'product_id_y']).size().unstack(fill_value=0)
size
统计每个列值对同时出现的行数count
对同一事物进行计数,但不为空。由于您没有提到任何有关空值的内容,因此我将在groupby
之后使用size
,然后使用unstack
df.groupby(['product_id_x', 'product_id_y']).size().unstack(fill_value=0)
我不明白你的意思。分组后,您将只得到与每个
产品\u id\u x
对应的一行。在这种情况下,您希望如何显示product\u id\u y
?我尝试了您的df2=df.groupby(['product\u id\u x']).size()
code,我将其修改为df2['count']=dataFrame.groupby(['product\u id\u x']).size()
,因为我想要一个大小的列名,但列名仍然没有显示出来。我不明白您的意思。分组后,您将只得到与每个产品\u id\u x
对应的一行。在这种情况下,您希望如何显示product\u id\u y
?我尝试了您的df2=df.groupby(['product\u id\u x']).size()
code,我将其修改为df2['count']=dataFrame.groupby(['product\u id\u x']).size()
,因为我需要一个大小的列名,但列名仍然没有显示出来