Python 如何删除所有drop重复记录并仅保留前两条记录
我有一个具有多个客户交易记录和唯一客户ID的数据集。我需要删除除前两个记录外的所有重复记录。我知道drop_duplicates的功能,但我需要弄清楚如何删除除前两个之外的所有内容 范例Python 如何删除所有drop重复记录并仅保留前两条记录,python,pandas,dataframe,duplicates,pandas-groupby,Python,Pandas,Dataframe,Duplicates,Pandas Groupby,我有一个具有多个客户交易记录和唯一客户ID的数据集。我需要删除除前两个记录外的所有重复记录。我知道drop_duplicates的功能,但我需要弄清楚如何删除除前两个之外的所有内容 范例 cust_ID transaction_Date ------ --------------- abc 01/01/2013 abc 02/09/2013 abc 06/06/2015 abc 09/09/2019 def 0
cust_ID transaction_Date
------ ---------------
abc 01/01/2013
abc 02/09/2013
abc 06/06/2015
abc 09/09/2019
def 02/01/2015
ghi 09/09/2013
def 09/02/2014
我的结果应该是:
cust_ID transaction_Date
------ ---------------
abc 01/01/2013
abc 02/09/2013
def 02/01/2015
ghi 09/09/2013
def 09/02/2014
这里保存了两份abc记录。其他的则被删除。def只有两条记录,并且所有两条记录都被维护,没有任何记录被删除
有什么办法吗?谢谢你的帮助。提前感谢一个简单的标题(2)
一个简单的头(2)
df.groupby('cust_ID').head(2)
Out[8]:
cust_ID transaction_Date
0 abc 01/01/2013
1 abc 02/09/2013
4 def 02/01/2015
5 ghi 09/09/2013
6 def 09/02/2014