Python 如何更新熊猫中的现有数据帧?

Python 如何更新熊猫中的现有数据帧?,python,pandas,dataframe,Python,Pandas,Dataframe,给定这两个数据帧: >>> df1 = pd.DataFrame({'c1':['a','a','b','b'], 'c2':['x','y','x','y'], 'val':0}) >>> df1 c1 c2 val 0 a x 0 1 a y 0 2 b x 0 3 b y 0 >>> df2 = pd.DataFrame({'c1':['a','a','b'], 'c2':['x','y'

给定这两个数据帧:

>>> df1 = pd.DataFrame({'c1':['a','a','b','b'], 'c2':['x','y','x','y'], 'val':0})
>>> df1
  c1 c2  val
0  a  x    0
1  a  y    0
2  b  x    0
3  b  y    0

>>> df2 = pd.DataFrame({'c1':['a','a','b'], 'c2':['x','y','y'], 'val':[12,31,14]})
>>> df2
  c1 c2  val
0  a  x   12
1  a  y   31
2  b  y   14
是否有一个函数从
df2
中提取
val
的元素,并将它们放入
df1
的相应索引中,从而导致:

>>> df1_updated 
  c1 c2  val
0  a  x   12
1  a  y   31
2  b  x    0
3  b  y   14
是的,看一看或者。例如:

>>> df1['val'] = df2['val'].combine_first(df1['val'])
>>> df1
Out[26]:
    c1  c2  val
0    a   x   12
1    a   y   31
2    b   x   14
3    b   y   0
编辑:根据c1和c2合并,忽略当前索引:

>>> df1['val'] = df2.set_index(['c1','c2'])['val'].combine_first(df1.set_index(['c1','c2'])['val']).values
>> df1
Out[25]:
    c1  c2  val
0    a   x   12
1    a   y   31
2    b   x   0
3    b   y   14

这是行不通的,因为它没有考虑df1索引。值14应该在b行yGreat中,非常感谢!同时也感谢你花时间来解决这个问题:)这对我不起作用。当我尝试时:
proxy.set_索引(['symbol','symboltype'])['proxy'])。首先组合_(symbols.set_索引(['symbol','symboltype'])['proxy'])。值
I获取:
异常:无法处理非唯一的多索引
@Yona,如果你创建一个新问题并发布一个新问题,可能会更好。可能是您的特定数据集存在问题,或者您可能在pandas中发现了错误!文档中说combine_first“首先选择调用序列的值。结果索引将是两个索引的并集。在本例中,df1['val']既不是NaN也不是null,因此它不会选择df2['val']。我在最新的熊猫身上试过这个,在comdbine_之后,第一个df1['val']仍然是0。为什么会有如图所示的输出?