Python Pandas Multindex:迭代行并添加特定值以创建新变量
我有一个带有多索引(id和datetime)的pandas数据帧和一个名为X1的列Python Pandas Multindex:迭代行并添加特定值以创建新变量,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个带有多索引(id和datetime)的pandas数据帧和一个名为X1的列 X1 id datetime a1ssjdldf 2019 Jul 10 2 2019 Jul 11 22 2019 Jul 12 21 r2dffs 2019 Jul 10 1
X1
id datetime
a1ssjdldf 2019 Jul 10 2
2019 Jul 11 22
2019 Jul 12 21
r2dffs 2019 Jul 10 14
2019 Jul 11 13
2019 Jul 12 11
我想创建一个新变量X2,其中对应的值是同一行的X1值和前一行的X1值之间的差值。但每次它看到一个新id时,相应的值必须从零重新启动
例如:
X1 X2
id datetime
a1ssjdldf 2019 Jul 10 2 0
2019 Jul 11 22 20
2019 Jul 12 21 -1
r2dffs 2019 Jul 10 14 0
2019 Jul 11 13 -1
2019 Jul 12 11 -2
按第一级使用,并将缺少的值替换为:
df['X2'] = df.groupby(level=0)['X1'].diff().fillna(0, downcast='int')
print (df)
X1 X2
id datetime
a1ssjdldf 2019 Jul 10 2 0
2019 Jul 11 22 20
2019 Jul 12 21 -1
r2dffs 2019 Jul 10 14 0
2019 Jul 11 13 -1
2019 Jul 12 11 -2