Python 连续值和固定值之间的差异百分比_Python_Pandas

Python 连续值和固定值之间的差异百分比

python pandas

Python 连续值和固定值之间的差异百分比,python,pandas,Python,Pandas,我想创建两个新列df['E']和df['F']，知道相同的A和B值始终对应于相同的D值： df['E']：D值相对于先前D值的方差百分比 df['F']：在12:00:00时，D值与先前D值之间的差异百分比输出应为： A B C D 0 2002-01-12 10:00:00 John 19 1 2002-01-12 11:00:00 Africa 15 2 2002-01-12 12:00:00 M

我想创建两个新列df['E']和df['F']，知道相同的A和B值始终对应于相同的D值：

df['E']：D值相对于先前D值的方差百分比

df['F']：在12:00:00时，D值与先前D值之间的差异百分比

输出应为：

            A         B        C   D
0  2002-01-12  10:00:00     John  19
1  2002-01-12  11:00:00   Africa  15
2  2002-01-12  12:00:00     Mary  30
3  2002-01-13  09:00:00    Billy   5
4  2002-01-13  11:00:00     Mira   6
5  2002-01-13  12:00:00  Hillary  50
6  2002-01-13  12:00:00   Romina  50
7  2002-01-14  10:00:00   George  30
8  2002-01-14  11:00:00   Denzel  12
9  2002-01-14  11:00:00  Michael  12
10 2002-01-14  12:00:00     Bisc  25
11 2002-01-16  10:00:00   Virgin  16
12 2002-01-16  11:00:00  Antonio  10
13 2002-01-16  12:00:00     Sito   5

有没有可能使用地图来获取它

我试过：

            A         B        C   D       E      F
0  2002-01-12  10:00:00     John  19       0      0
1  2002-01-12  11:00:00   Africa  15  -21.05      0
2  2002-01-12  12:00:00     Mary  30  100.00      0
3  2002-01-13  09:00:00    Billy   5  -83.33 -83.33
4  2002-01-13  11:00:00     Mira   6   20.00 -80.00
5  2002-01-13  12:00:00  Hillary  50  733.33  66.66
6  2002-01-13  12:00:00   Romina  50  733.33  66.66
7  2002-01-14  10:00:00   George  30  -40.00 -40.00
8  2002-01-14  11:00:00   Denzel  12  -60.00 -76.00
9  2002-01-14  11:00:00  Michael  12  -60.00 -76.00
10 2002-01-14  12:00:00     Bisc  25  108.33 -50.00
11 2002-01-16  10:00:00   Virgin  16  -36.00 -36.00
12 2002-01-16  11:00:00  Antonio  10  -37.50 -60.00
13 2002-01-16  12:00:00     Sito   5  -50.00 -80.00

使用：

说明：

对于使用列E，则将0替换为NaN，并向前填充NaN。对于F列，按B列中12:00:00的行映射A列

完美的耶斯雷尔！非常感谢。

x = df[df['B'].eq(time(12))].drop_duplicates(subset=['A']).set_index('A')['D'](100 * (df.D - df.D.shift(1)) / df.D.shift(1)).fillna(0)
df['F'] = df['A'].map(x)

df['E'] = df['D'].pct_change().mul(100).replace(0,np.nan).ffill().fillna(0).round(2)
s = df[df['B'].eq(time(12))].drop_duplicates(subset=['A']).set_index('A')['D']
df['F'] = (df['D'].div(df['A'].map(s.shift()))).sub(1).mul(100).round(2).fillna(0)
print (df)
             A         B        C   D       E      F
0   2002-01-12  10:00:00     John  19    0.00   0.00
1   2002-01-12  11:00:00   Africa  15  -21.05   0.00
2   2002-01-12  12:00:00     Mary  30  100.00   0.00
3   2002-01-13  09:00:00    Billy   5  -83.33 -83.33
4   2002-01-13  11:00:00     Mira   6   20.00 -80.00
5   2002-01-13  12:00:00  Hillary  50  733.33  66.67
6   2002-01-13  12:00:00   Romina  50  733.33  66.67
7   2002-01-14  10:00:00   George  30  -40.00 -40.00
8   2002-01-14  11:00:00   Denzel  12  -60.00 -76.00
9   2002-01-14  11:00:00  Michael  12  -60.00 -76.00
10  2002-01-14  12:00:00     Bisc  25  108.33 -50.00
11  2002-01-16  10:00:00   Virgin  16  -36.00 -36.00
12  2002-01-16  11:00:00  Antonio  10  -37.50 -60.00
13  2002-01-16  12:00:00     Sito   5  -50.00 -80.00