Python 删除具有三个条件的重复项,包括

Python 删除具有三个条件的重复项,包括,python,pandas,Python,Pandas,我有以下数据帧: reference | topcredit | currentbalance | creditlimit 1 1 | 50 | 20 | 70 2 1 | 30 | 28 | 50 3 1 | 50 | 20 | 70 4 1 |

我有以下数据帧:

     reference | topcredit | currentbalance | creditlimit
  1      1      |    50     |       20       |      70
  2      1      |    30     |       28       |      50
  3      1      |    50     |       20       |      70
  4      1      |    81     |       32       |      100
  5      2      |    70     |        0       |      56
  6      2      |    50     |       20       |      70
  7      2      |   100     |        0       |      150
  8      3      |    85     |       85       |      95
  9      3      |    85     |       85       |      95
等等

我想删除基于“参考”的副本,只删除那些具有相同topcredit、currentbalance和creditlimit的副本

在参考文献1中,我有两个在第1行和第3行的三列中有相同的数字,但在参考文献2中,第6行我想保留参考文献1的第1行和参考文献2的第6行。在参考文献3中,两行也具有相同的信息

预期产出为:

 reference | topcredit | currentbalance | creditlimit
    1      |    50     |       20       |      70
    1      |    30     |       28       |      50
    1      |    81     |       32       |      100
    2      |    70     |       24       |      56
    2      |    50     |       20       |      70
    2      |   100     |       80       |      150
    3      |    85     |       85       |      95

我非常感谢您的帮助,我已经搜索了一段时间了。

df.drop_duplicates()
,还是我遗漏了什么?基于3个条件,您如何做到这一点:topcredit、currentbalance和creditlimit在每个引用中的两行相同?如果我在当前余额或任何其他列上删除重复项,则引用2也会被删除。您在所有列上删除重复项(即,只需不指定任何内容),这样,只有当同一引用具有相同的topcredit和currentbalance以及creditlimit时,行才会被删除。哇,谢谢!我想到了非常复杂的解决方案,但我没有想到这么简单的解决方案。谢谢@a所有可能重复的
df.drop_duplicates()
,或者我遗漏了什么?如何根据3个条件进行操作:topcredit、currentbalance和creditlimit在每个引用中的两行相同?如果我在当前余额或任何其他列上删除重复项,则引用2也会被删除。您在所有列上删除重复项(即,只需不指定任何内容),这样,只有当同一引用具有相同的topcredit和currentbalance以及creditlimit时,行才会被删除。哇,谢谢!我想到了非常复杂的解决方案,但我没有想到这么简单的解决方案。谢谢@所有可能的副本