Python Df.drop/delete重复行
如何删除一行的精确副本。因此,如果我有一个数据帧,看起来是这样的:Python Df.drop/delete重复行,python,pandas,dataframe,Python,Pandas,Dataframe,如何删除一行的精确副本。因此,如果我有一个数据帧,看起来是这样的: A B C 1 2 3 3 2 2 1 2 3 现在,我的数据框比这大很多,但这是一种让python查看每一行的方法,如果行中的值与另一行中的值完全相同,只需删除该行即可。我想考虑整个数据帧,我不想指定要获取唯一值的列。您可以获得一个重复数据消除的数据帧,其值与: 返回: >>> df[~df.duplicated(['A','B','C'])] A B
A B C
1 2 3
3 2 2
1 2 3
现在,我的数据框比这大很多,但这是一种让python查看每一行的方法,如果行中的值与另一行中的值完全相同,只需删除该行即可。我想考虑整个数据帧,我不想指定要获取唯一值的列。您可以获得一个重复数据消除的数据帧,其值与: 返回:
>>> df[~df.duplicated(['A','B','C'])]
A B C
0 1 2 3
1 3 2 2
您可以获得与以下相反的重复数据消除数据帧: 返回:
>>> df[~df.duplicated(['A','B','C'])]
A B C
0 1 2 3
1 3 2 2
您可以使用以下方法:
您可以使用以下方法:
现在我意识到这是最简单的方法,谢谢@MaxU@伯尼,熊猫的API非常丰富,所以通常我们可以用很多不同的方法来实现相同的目标;-)我已经试过了,它不起作用,它仍然显示一些重复的reason@Cannon,你能提供一个可复制的数据集吗?我实际上只使用了df.duplicated().sum,显然我没有重复项。我有一个问题,我是如何把数据,所以一对夫妇列是不同的,我没有看得足够近。对不起,伙计们,我只是认为df.drop_列不起作用。现在我意识到,这是更简单的方法,谢谢@MaxU@伯尼,熊猫的API非常丰富,所以通常我们可以用很多不同的方法来实现相同的目标;-)我已经试过了,它不起作用,它仍然显示一些重复的reason@Cannon,你能提供一个可复制的数据集吗?我实际上只使用了df.duplicated().sum,显然我没有重复项。我有一个问题,我是如何把数据,所以一对夫妇列是不同的,我没有看得足够近。对不起,伙计们,我只是觉得df.drop_列不起作用
In [23]: df
Out[23]:
A B C
0 1 2 3
1 3 2 2
2 1 2 3
In [24]: df.drop_duplicates()
Out[24]:
A B C
0 1 2 3
1 3 2 2