Pandas (熊猫)为什么.bfill().ffill()在组上的行为与ffill().bfill()不同?
我想我在概念上遗漏了一些基本的东西,但我无法在文档中找到答案Pandas (熊猫)为什么.bfill().ffill()在组上的行为与ffill().bfill()不同?,pandas,group-by,pandas-groupby,Pandas,Group By,Pandas Groupby,我想我在概念上遗漏了一些基本的东西,但我无法在文档中找到答案 >>> df=pd.DataFrame({'a':[1,1,2,2,3,3], 'b':[5,np.nan, 6, np.nan, np.nan, np.nan]}) >>> df a b 0 1 5.0 1 1 NaN 2 2 6.0 3 2 NaN 4 3 NaN 5 3 NaN 使用ffill()和bfill(): 使用bfill()和ffill(): 第
>>> df=pd.DataFrame({'a':[1,1,2,2,3,3], 'b':[5,np.nan, 6, np.nan, np.nan, np.nan]})
>>> df
a b
0 1 5.0
1 1 NaN
2 2 6.0
3 2 NaN
4 3 NaN
5 3 NaN
使用ffill()和bfill():
使用bfill()和ffill():
第二条路不是打破了分组吗?第一种方法是否始终确保仅使用该组中的其他值填写值?我认为您需要:
print (df.groupby('a')['b'].apply(lambda x: x.ffill().bfill()))
0 5.0
1 5.0
2 6.0
3 6.0
4 NaN
5 NaN
Name: b, dtype: float64
print (df.groupby('a')['b'].apply(lambda x: x.bfill().ffill()))
0 5.0
1 5.0
2 6.0
3 6.0
4 NaN
5 NaN
Name: b, dtype: float64
因为在您的示例中,只有第一个ffill
或bfill
是或,第二个是处理输出系列
。所以它将分组,因为系列
没有分组
print (df.groupby('a')['b'].ffill())
0 5.0
1 5.0
2 6.0
3 6.0
4 NaN
5 NaN
Name: b, dtype: float64
print (df.groupby('a')['b'].bfill())
0 5.0
1 NaN
2 6.0
3 NaN
4 NaN
5 NaN
Name: b, dtype: float64
print (df.groupby('a')['b'].apply(lambda x: x.ffill().bfill()))
0 5.0
1 5.0
2 6.0
3 6.0
4 NaN
5 NaN
Name: b, dtype: float64
print (df.groupby('a')['b'].apply(lambda x: x.bfill().ffill()))
0 5.0
1 5.0
2 6.0
3 6.0
4 NaN
5 NaN
Name: b, dtype: float64
print (df.groupby('a')['b'].ffill())
0 5.0
1 5.0
2 6.0
3 6.0
4 NaN
5 NaN
Name: b, dtype: float64
print (df.groupby('a')['b'].bfill())
0 5.0
1 NaN
2 6.0
3 NaN
4 NaN
5 NaN
Name: b, dtype: float64