Python 熊猫的子集数据

Python 熊猫的子集数据,python,pandas,dataframe,subset,Python,Pandas,Dataframe,Subset,我有一个pandas数据框,包含Cust\u email、visit\u date\u time、transaction\u date\u time列Cust\u email包含客户的电子邮件id,visit\u date\u time包含客户访问产品时的时间戳,transaction\u date\u time包含客户购买该产品时的交易时间戳,否则该字段保持为空 现在,我想对panda(所有列)进行子集,这些panda只包含至少进行了一次交易的电子邮件ID,即,我想删除所有电子邮件ID,这些电

我有一个pandas数据框,包含
Cust\u email、visit\u date\u time、transaction\u date\u time
Cust\u email
包含客户的电子邮件id,
visit\u date\u time
包含客户访问产品时的时间戳,
transaction\u date\u time
包含客户购买该产品时的交易时间戳,否则该字段保持为空

现在,我想对panda(所有列)进行子集,这些panda只包含至少进行了一次交易的电子邮件ID,即,我想删除所有电子邮件ID,这些电子邮件ID的所有
访问日期时间、交易日期时间
组合

,您可以使用它们来测试客户ID的成员身份,我们首先过滤未完成的交易中的df,从这些行中获取客户id并传递到
isin

df['df['Cust_email'].isin(df.loc[df['transaction_date_time'].notnull(), 'Cust_email'].unique())

所以您需要
df[df['transaction\u date\u time'].notnull()]
?例如,不需要
abc@gmail.com
有三条记录,其中两条记录没有
事务\u日期\u时间
。但是,既然他做了一笔交易,我也想要他的另外两条记录。所以你想要
df['df['Cust_email'].isin(df.loc[df['transaction_date_time'].notnull(),'Cust_email'].unique())
?@EdChum谢谢你。这很有效。