如何使用Python从2个excels中获取额外和丢失的数据

如何使用Python从2个excels中获取额外和丢失的数据,python,pandas,Python,Pandas,我有2个excel csv文件,如下所示 df1 = {'Transaction_Name':['SC-001_Homepage', 'SC-002_Homepage', 'SC-001_Signinlink'], 'Count': [1, 1, 2]} df1 = pd.DataFrame(df1, columns=df1.keys()) df2 = {'Transaction_Name':['SC-002_Homepage', 'SC-001_Signinlink', 'SC-002_

我有2个excel csv文件,如下所示

df1 =  {'Transaction_Name':['SC-001_Homepage', 'SC-002_Homepage', 'SC-001_Signinlink'], 'Count': [1, 1, 2]}
df1 = pd.DataFrame(df1, columns=df1.keys())

df2 =  {'Transaction_Name':['SC-002_Homepage', 'SC-001_Signinlink', 'SC-002_Signinlink'], 'Count': [1, 2, 1]}
df2 = pd.DataFrame(df2, columns=df2.keys())
我想比较两个数据,我可以用下面的

  df_compare = df1.merge(df2, on='Transaction_Name', suffixes=('_df1','_df2'))
df_compare[['Count_df1','Count_df2']] = df_compare[['Count_df1','Count_df2']].astype(float).astype(int)
print (df_compare)
但在df1中,SC-001_主页存在,而在df2中不存在。使用上述代码,我无法获得SC-001_主页的结果。同样,在df2 SC-002中,存在符号链接,但在df1中不可用。结果中也缺少此值。有人能帮助我如何在结果中包含这些事务吗

预期结果应该是

 Transaction_Name    Count_df1  Count_df2
0   SC-001_Homepage       1       0
1   SC-002_Homepage       1       1
2   SC-001_Signinlink     2       2
3   SC-002_Signinlink     0       1
使用:

如果要将浮点转换为int,请使用:

df_new[df_new.select_dtypes(['float']).columns]= df_new.select_dtypes(['float']).astype(int)

很高兴。。!!祝你一切顺利你能帮我找出计数df1和计数df2之间的百分比差异吗?下面是预期输出的示例<代码>交易\名称计数\ df1计数\ df2差异0 SC-001 \主页1.0 0.0(1-0)/1差异公式应为(计数\ df1-计数\ df2)/Count_df1@SwethaGorantla,我不明白是这样的:(建议发布一个新的问题,我可以在那里得到图片和答案。)同样,也不建议迭代调试。:)谢谢,我将发布一个新问题
df_new[df_new.select_dtypes(['float']).columns]= df_new.select_dtypes(['float']).astype(int)