Python 如何更新熊猫中的现有数据帧?
给定这两个数据帧:Python 如何更新熊猫中的现有数据帧?,python,pandas,dataframe,Python,Pandas,Dataframe,给定这两个数据帧: >>> df1 = pd.DataFrame({'c1':['a','a','b','b'], 'c2':['x','y','x','y'], 'val':0}) >>> df1 c1 c2 val 0 a x 0 1 a y 0 2 b x 0 3 b y 0 >>> df2 = pd.DataFrame({'c1':['a','a','b'], 'c2':['x','y'
>>> df1 = pd.DataFrame({'c1':['a','a','b','b'], 'c2':['x','y','x','y'], 'val':0})
>>> df1
c1 c2 val
0 a x 0
1 a y 0
2 b x 0
3 b y 0
>>> df2 = pd.DataFrame({'c1':['a','a','b'], 'c2':['x','y','y'], 'val':[12,31,14]})
>>> df2
c1 c2 val
0 a x 12
1 a y 31
2 b y 14
是否有一个函数从df2
中提取val
的元素,并将它们放入df1
的相应索引中,从而导致:
>>> df1_updated
c1 c2 val
0 a x 12
1 a y 31
2 b x 0
3 b y 14
是的,看一看或者。例如:
>>> df1['val'] = df2['val'].combine_first(df1['val'])
>>> df1
Out[26]:
c1 c2 val
0 a x 12
1 a y 31
2 b x 14
3 b y 0
编辑:根据c1和c2合并,忽略当前索引:
>>> df1['val'] = df2.set_index(['c1','c2'])['val'].combine_first(df1.set_index(['c1','c2'])['val']).values
>> df1
Out[25]:
c1 c2 val
0 a x 12
1 a y 31
2 b x 0
3 b y 14
这是行不通的,因为它没有考虑df1索引。值14应该在b行yGreat中,非常感谢!同时也感谢你花时间来解决这个问题:)这对我不起作用。当我尝试时:
proxy.set_索引(['symbol','symboltype'])['proxy'])。首先组合_(symbols.set_索引(['symbol','symboltype'])['proxy'])。值
I获取:异常:无法处理非唯一的多索引
@Yona,如果你创建一个新问题并发布一个新问题,可能会更好。可能是您的特定数据集存在问题,或者您可能在pandas中发现了错误!文档中说combine_first“首先选择调用序列的值。结果索引将是两个索引的并集。在本例中,df1['val']既不是NaN也不是null,因此它不会选择df2['val']。我在最新的熊猫身上试过这个,在comdbine_之后,第一个df1['val']仍然是0。为什么会有如图所示的输出?