Python 删除具有三个条件的重复项,包括
我有以下数据帧:Python 删除具有三个条件的重复项,包括,python,pandas,Python,Pandas,我有以下数据帧: reference | topcredit | currentbalance | creditlimit 1 1 | 50 | 20 | 70 2 1 | 30 | 28 | 50 3 1 | 50 | 20 | 70 4 1 |
reference | topcredit | currentbalance | creditlimit
1 1 | 50 | 20 | 70
2 1 | 30 | 28 | 50
3 1 | 50 | 20 | 70
4 1 | 81 | 32 | 100
5 2 | 70 | 0 | 56
6 2 | 50 | 20 | 70
7 2 | 100 | 0 | 150
8 3 | 85 | 85 | 95
9 3 | 85 | 85 | 95
等等
我想删除基于“参考”的副本,只删除那些具有相同topcredit、currentbalance和creditlimit的副本
在参考文献1中,我有两个在第1行和第3行的三列中有相同的数字,但在参考文献2中,第6行我想保留参考文献1的第1行和参考文献2的第6行。在参考文献3中,两行也具有相同的信息
预期产出为:
reference | topcredit | currentbalance | creditlimit
1 | 50 | 20 | 70
1 | 30 | 28 | 50
1 | 81 | 32 | 100
2 | 70 | 24 | 56
2 | 50 | 20 | 70
2 | 100 | 80 | 150
3 | 85 | 85 | 95
我非常感谢您的帮助,我已经搜索了一段时间了。
df.drop_duplicates()
,还是我遗漏了什么?基于3个条件,您如何做到这一点:topcredit、currentbalance和creditlimit在每个引用中的两行相同?如果我在当前余额或任何其他列上删除重复项,则引用2也会被删除。您在所有列上删除重复项(即,只需不指定任何内容),这样,只有当同一引用具有相同的topcredit和currentbalance以及creditlimit时,行才会被删除。哇,谢谢!我想到了非常复杂的解决方案,但我没有想到这么简单的解决方案。谢谢@a所有可能重复的df.drop_duplicates()
,或者我遗漏了什么?如何根据3个条件进行操作:topcredit、currentbalance和creditlimit在每个引用中的两行相同?如果我在当前余额或任何其他列上删除重复项,则引用2也会被删除。您在所有列上删除重复项(即,只需不指定任何内容),这样,只有当同一引用具有相同的topcredit和currentbalance以及creditlimit时,行才会被删除。哇,谢谢!我想到了非常复杂的解决方案,但我没有想到这么简单的解决方案。谢谢@所有可能的副本