Python 熊猫与索引中的重复值合并_Python_Pandas

Python 熊猫与索引中的重复值合并

python pandas

Python 熊猫与索引中的重复值合并,python,pandas,Python,Pandas,你好, 我有以下两个数据帧（df1、df2），如果我合并它们（内部连接），我会得到以下数据帧： In [85]: df1 = pd.DataFrame({'value' : [10, 11, 14, 16]}, index=[1, 2, 3, 3]); df1 Out[85]: value 1 10 2 11 3 14

你好,

我有以下两个数据帧（df1、df2），如果我合并它们（内部连接），我会得到以下数据帧：

In [85]: df1 = pd.DataFrame({'value' : [10, 11, 14, 16]}, index=[1, 2, 3, 3]); df1                 
Out[85]:             
   value             
1     10             
2     11             
3     14             
3     16             

In [86]: df2 = pd.DataFrame({'value' : [11, 15, 16]}, index=[1, 3, 3]); df2                        
Out[86]:             
   value             
1     11             
3     15             
3     16             

In [87]: pd.merge(df1, df2, how='inner', left_index=True, right_index=True)                        
Out[87]:             
   value_x  value_y  
1       10       11  
3       14       15  
3       14       16  
3       16       15  
3       16       16

与此相反，我希望使用以下数据帧

    value_x  value_y 
1     10      11     
3     14      15     
3     16      16

基本上，在重复行的情况下，不要以当前发生的方式进行

m*n

合并

我们需要一个新的段落

key

，使用

groupby

cumcount

pd.merge(df1.assign(key=df1.groupby(level=0).cumcount()).reset_index(),
    df2.assign(key=df2.groupby(level=0).cumcount()).reset_index(),
         how='inner',on=['index','key']).\
             drop('key',1).set_index('index')
Out[25]: 
       value_x  value_y
index                  
1           10       11
3           14       15
3           16       16