使用Python查找两个excel中缺少的事务
我有2个excel csv文件,如下所示使用Python查找两个excel中缺少的事务,python,pandas,Python,Pandas,我有2个excel csv文件,如下所示 df1 = {'Transaction_Name':['SC-001_Homepage', 'SC-002_Homepage', 'SC-003_Homepage', 'SC-001_Signinlink'], 'Count': [1, 0, 2, 1]} df1 = pd.DataFrame(df1, columns=df1.keys()) df2 = {'Transaction_Name':['SC-001_Homepage', 'SC-002
df1 = {'Transaction_Name':['SC-001_Homepage', 'SC-002_Homepage', 'SC-003_Homepage', 'SC-001_Signinlink'], 'Count': [1, 0, 2, 1]}
df1 = pd.DataFrame(df1, columns=df1.keys())
df2 = {'Transaction_Name':['SC-001_Homepage', 'SC-002_Homepage', 'SC-001_Signinlink', 'SC-002_Signinlink'], 'Count': [2, 1, 2, 1]}
df2 = pd.DataFrame(df2, columns=df2.keys())
在df1
中,我可以看到有一个名为SC-003_Homepage
的额外事务,它不在df2
中。有人能帮我找到df2
中缺少的事务吗
到目前为止,我已经做了以下工作来获得交易
merged_df = pd.merge(df1, df2, on = 'Transaction_Name', suffixes=('_df1', '_df2'), how='inner')
也许一个简单的
set
就能完成这项工作
set(df1['Transaction\u Name'])-set(df2['Transaction\u Name'])
添加合并列,然后根据该列筛选缺少的数据。参见下面的示例
有关更多信息,请参阅
输出:
Count Transaction_Name
2 2.0 SC-003_Homepage
Count Transaction_Name
4 NaN SC-002_Signinlink
谢谢Chandila,它解决了我的问题并获得了所需的输出。您还可以帮助我在df2中查找df1中没有的其他事务吗?@SwethaGorantla请查看我编辑的答案以了解您的查询。
Count Transaction_Name
2 2.0 SC-003_Homepage
Count Transaction_Name
4 NaN SC-002_Signinlink