Python 熊猫:在时差条件下重复;代码 大熊猫:需要找出同一客户的重复问题:问题只考虑在相同代码的30天内重复发生。

Python 熊猫:在时差条件下重复;代码 大熊猫:需要找出同一客户的重复问题:问题只考虑在相同代码的30天内重复发生。,python,pandas,dataframe,duplicates,iteration,Python,Pandas,Dataframe,Duplicates,Iteration,让我们尝试按客户ID和问题代码分组,并找出每个组中日期的连续差异。将时间delata转换为天,并检查结果绝对值是否小于或等于30 但是,请认真注意上面的评论 df['Date']=pd.to_datetime(df['Date'])# Coerce date to datetime df[abs(df.groupby(['CT_ID','Problem_code'])['Date'].diff().dt.days).le(30)] CT_ID Problem_code

让我们尝试按客户ID和问题代码分组,并找出每个组中日期的连续差异。将时间delata转换为天,并检查结果绝对值是否小于或等于30

但是,请认真注意上面的评论

df['Date']=pd.to_datetime(df['Date'])# Coerce date to datetime

df[abs(df.groupby(['CT_ID','Problem_code'])['Date'].diff().dt.days).le(30)]


    CT_ID     Problem_code                Date
3   XO1       code_1                  2021-01-03 11:35:00
5   XO3       code_4                  2020-09-20 09:35:00
8   XO3       code_4                  2020-10-10 11:35:00

这条链子有用吗?也就是说,3月1日、3月15日、4月8日是否都是重复事件,或者我们是否标记第一个3月1日,将3月15日标记为该事件的重复事件,但是4月8日(从3月1日开始>30天)现在是它自己的代码或数据事件。始终提供代码、数据、错误、当前输出和预期输出,如图所示。如果相关,打印图像也可以。请看。提供数据,然后是您的问题,并将剪贴板粘贴到代码块中。非常感谢您的帮助