Python 数据帧中的信息矩阵
我有一个熊猫数据框,如下所示:Python 数据帧中的信息矩阵,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个熊猫数据框,如下所示: Customer Id year 0 1510220024 2017 1 1510270013 2017 2 1511160047 2017 3 1512100014 2017 4 1603180006 2017 5 1605030030 2017 6 1605160013 2017 7 1606060008 2017 8 1510
Customer Id year
0 1510220024 2017
1 1510270013 2017
2 1511160047 2017
3 1512100014 2017
4 1603180006 2017
5 1605030030 2017
6 1605160013 2017
7 1606060008 2017
8 1510220024 2018
9 1606270014 2017
10 1608080011 2017
11 1608090002 2017
12 1511160047 2018
13 1606270014 2018
我想从上面的数据框中构建以下矩阵:
2017 2018
2017 11 3
2018 3 3
该矩阵显示,2017年共有11家客户,其中3家也出现在2018年,以此类推。实际上,我有7年的数据,所以它将是7x7矩阵。我现在挣扎了一段时间,但没能做到这一点
合并
+交叉表
:
m = df.merge(df, left_on='Customer Id', right_on='Customer Id')
pd.crosstab(m.year_x, m.year_y)
您能否解释一下第二列,
[3,3]
?第一行中的3表示2017年出现的11个客户中,有3个也出现在2018年,以此类推。
year_y 2017 2018
year_x
2017 11 3
2018 3 3