Python 如果开始和结束订阅日期在14天内,则按订阅服务器进行筛选和分组 我有一个报纸数据集,我认为订阅者在14天内结束并重新订阅。因此,我想比较CRM关系号的每个结束日期和每个开始日期。如果在14天内,我想创建一个新列,其中索引作为列表与原始数据帧中的索引相对应

Python 如果开始和结束订阅日期在14天内,则按订阅服务器进行筛选和分组 我有一个报纸数据集,我认为订阅者在14天内结束并重新订阅。因此,我想比较CRM关系号的每个结束日期和每个开始日期。如果在14天内,我想创建一个新列,其中索引作为列表与原始数据帧中的索引相对应,python,pandas,Python,Pandas,输入: df=pd.DataFrame({'index':[1,2,3,4,5,6],'CRM_relation_number':[“PRS-1000005”,“PRS-1000005”,“PRS-1000005”,“PRS-1000017”,“PRS-1000017”,“PRS-1000017”],“报纸名称”:[“stackoverflow_次”,“stackoverflow_post”,“stackoverflow_post”,“overflow_次”,“stackoverflow_次”,

输入:
df=pd.DataFrame({'index':[1,2,3,4,5,6],'CRM_relation_number':[“PRS-1000005”,“PRS-1000005”,“PRS-1000005”,“PRS-1000017”,“PRS-1000017”,“PRS-1000017”],“报纸名称”:[“stackoverflow_次”,“stackoverflow_post”,“stackoverflow_post”,“overflow_次”,“stackoverflow_次”,“stackoverflow_次”],“Startdate:[“2016-12-07”“2020-07-04”、“2019-09-28”、“2019-01-04”、“2018-01-02”、“2016-09-17”]、“停止日期”:[“2019-07-03”、“2020-09-20”、“2020-07-03”、“2019-11-11”、“2018-12-31”、“2017-12-29”])

预期产出:

index   CRM_relation_number     newspaper_name              Startdate   Stopdate    follow_up_subsprcition
    3      PRS-1000005          the_stackoverflow_post    2019-09-28    2020-07-03  [2]
    4      PRS-1000017          stackoverflow_times       2019-01-04    2019-11-11  [5, 6]

14天分组条件与检索到的数据不匹配。订阅期的门槛是多少?@r-初学者啊,很抱歉出现了一个小错误。我修复了它。我检查了修改的行,但它不符合问题中的14天,其他ID也不符合。因此索引6的停止日期为2017-12-29-索引5的开始日期为2018-01-02=4天,因此在14天内!索引有5个停止日期2018-12-31-索引4开始日期2019-01-04=4天,因此后续子循环列得到一个包含[5,6]的列表。我理解评论中的期限要求,但我不理解为什么预期输出中的索引3是旧日期,而索引4是新日期。
index   CRM_relation_number     newspaper_name              Startdate   Stopdate    follow_up_subsprcition
    3      PRS-1000005          the_stackoverflow_post    2019-09-28    2020-07-03  [2]
    4      PRS-1000017          stackoverflow_times       2019-01-04    2019-11-11  [5, 6]