Python 熊猫如何在不创建新列的情况下进行外部联接
我有两个数据帧,如下所示:Python 熊猫如何在不创建新列的情况下进行外部联接,python,pandas,Python,Pandas,我有两个数据帧,如下所示: date value 20100101 100 20100102 150 date value 20100102 150.01 20100103 180 预期产出应为: date value 20100101 100 20100102 150 20100103 180 第二个数据帧总是包含我想添加到第一个数据帧中的最新值。但是,两个数据帧在同一天的值可能略有不同。我希望忽略相同的日期,并将重点放在将新的日期和值添加到第
date value
20100101 100
20100102 150
date value
20100102 150.01
20100103 180
预期产出应为:
date value
20100101 100
20100102 150
20100103 180
第二个数据帧总是包含我想添加到第一个数据帧中的最新值。但是,两个数据帧在同一天的值可能略有不同。我希望忽略相同的日期,并将重点放在将新的日期和值添加到第一个数据帧中
我在pandas中尝试了outer join
,但它给了我两列value\u x
和value\u y
,因为在相同的日期,值本质上是不同的。有什么解决办法吗?我认为需要:
什么是预期输出?我已经添加了预期输出,干杯如果我想在日期相同时保留df1的值,该怎么办?
df = pd.concat([df1,df2]).drop_duplicates('date', keep='last')
print (df)
date value
0 20100101 100.00
0 20100102 150.01
1 20100103 180.00
df = pd.concat([df1,df2]).drop_duplicates('date', keep='first')
print (df)
date value
0 20100101 100.0
1 20100102 150.0
1 20100103 180.0