Python 用给定的值填充数据帧,直到第一个数据点和最后一个数据点
获取以下测试数据帧:Python 用给定的值填充数据帧,直到第一个数据点和最后一个数据点,python,pandas,dataframe,Python,Pandas,Dataframe,获取以下测试数据帧: test_df = pd.DataFrame({'col_a' : [np.nan, np.nan, 4.0, 5.0, 12.0, 45.0, 86.0, 92.0, np.nan, np.nan, np.nan]}) test_df col_a 0 NaN 1 NaN 2 4.0 3 5.0 4 12.0 5 45.0 6 86.0 7 92.0 8 NaN 9 NaN 10 NaN 现在我想用值0.0填充列a中的所
test_df = pd.DataFrame({'col_a' : [np.nan, np.nan, 4.0, 5.0, 12.0, 45.0, 86.0, 92.0, np.nan, np.nan, np.nan]})
test_df
col_a
0 NaN
1 NaN
2 4.0
3 5.0
4 12.0
5 45.0
6 86.0
7 92.0
8 NaN
9 NaN
10 NaN
现在我想用值0.0填充列a
中的所有NAs,直到第一个数据点(4.0)
我还想将最新数据点(92.0)中的所有NAs替换为100.0
方法的关键字value
和method
的组合似乎不像我最初希望的那样有效
你能帮忙吗?越像蟒蛇,就越好。多谢各位
++++
编辑
实际上,我可以从填充数据框顶部开始,如下所示:
test_df.loc[0:test_df['col_a'].first_valid_index()] = test_df.loc[0:test_df['col_a'].first_valid_index()].fillna(value=0)
然后使用fillna
方法替换NAs left,但它非常难看,难以处理无数列和其他数据帧约束
++++++通过由创建的最大值(由
cumsum
创建)的助手序列赋值,然后通过比较min
和max
创建掩码,但对于max,有必要忽略最后一个非NaN
值:
a = test_df['col_a'].notnull().cumsum()
print (a)
0 0
1 0
2 1
3 2
4 3
5 4
6 5
7 6
8 6
9 6
10 6
Name: col_a, dtype: int32
test_df[a == a.min()] = 0
test_df[a.shift() == a.max()] = 100
print (test_df)
col_a
0 0.0
1 0.0
2 4.0
3 5.0
4 12.0
5 45.0
6 86.0
7 92.0
8 100.0
9 100.0
10 100.0