Python 对数据帧中每列的行数重复项进行计数
我有一张很长的桌子,如下所示:Python 对数据帧中每列的行数重复项进行计数,python,pandas,dataframe,duplicates,Python,Pandas,Dataframe,Duplicates,我有一张很长的桌子,如下所示: A B C D ....... 0 au br gt uy 1 cd gq gt uy 2 fg br gt ml 3 kl br gt wx 我想计算并打印每列的副本,如: A 0 B 2 C 3 D 1 我只发现了一列的重复数: df.duplicated(['B']).sum() 我是否必须写所有的专栏(
A B C D .......
0 au br gt uy
1 cd gq gt uy
2 fg br gt ml
3 kl br gt wx
我想计算并打印每列的副本,如:
A 0
B 2
C 3
D 1
我只发现了一列的重复数:
df.duplicated(['B']).sum()
我是否必须写所有的专栏(大约30篇),或者是否可以使用熊猫的内容?我尝试过这个,但不起作用:
df.duplicated(df.loc[:,:]).sum()
用以下公式减去数据帧的长度: 或者分别使用for get boolean mask和
sum
对True
值进行计数:
df = df.apply(lambda x: x.duplicated()).sum()
print (df)
A 0
B 2
C 3
D 1
dtype: int64
df = df.apply(lambda x: x.duplicated()).sum()
print (df)
A 0
B 2
C 3
D 1
dtype: int64