Python 将重叠行放置在外连接中
我想合并两个dataframe并丢弃索引(id)上重叠的行 我的尝试:Python 将重叠行放置在外连接中,python,pandas,Python,Pandas,我想合并两个dataframe并丢弃索引(id)上重叠的行 我的尝试: outer_join = pd.merge(dfA, dfB, on='id', how='outer') outer_join.loc[~dfA.id.isin(outer_join.id)] 我的预期产出: id group size 001 B S 002 C S 003 A XL 004 A
outer_join = pd.merge(dfA, dfB, on='id', how='outer')
outer_join.loc[~dfA.id.isin(outer_join.id)]
我的预期产出:
id group size
001 B S
002 C S
003 A XL
004 A M
先使用
联合收割机
:
print (dfA.set_index("id").combine_first(dfB.set_index("id")))
group size
id
1 B S
2 C S
3 A XL
4 A M
试一试
newdf = pd.concat([dfA, dfB]).groupby('id').head(1)
print (dfA.set_index("id").combine_first(dfB.set_index("id")))
group size
id
1 B S
2 C S
3 A XL
4 A M
newdf = pd.concat([dfA, dfB]).groupby('id').head(1)