Time 熊猫:groupby中的时差
如何计算当前行和下一行之间每个id的时间差 数据集如下:Time 熊猫:groupby中的时差,time,pandas-groupby,difference,Time,Pandas Groupby,Difference,如何计算当前行和下一行之间每个id的时间差 数据集如下: time id 2012-03-16 23:50:00 1 2012-03-16 23:56:00 1 2012-03-17 00:08:00 1 2012-03-17 00:10:00 2 2012-03-17 00:12:00 2 2012-03-17 00:20:00 2 2012-03-20 00:43:00 3 并得到
time id
2012-03-16 23:50:00 1
2012-03-16 23:56:00 1
2012-03-17 00:08:00 1
2012-03-17 00:10:00 2
2012-03-17 00:12:00 2
2012-03-17 00:20:00 2
2012-03-20 00:43:00 3
并得到下一个结果:
time id tdiff
2012-03-16 23:50:00 1 6
2012-03-16 23:56:00 1 12
2012-03-17 00:08:00 1 NA
2012-03-17 00:10:00 2 2
2012-03-17 00:12:00 2 8
2012-03-17 00:20:00 2 NA
2012-03-20 00:43:00 3 NA
我知道您需要
id
在几分钟内得出结果。以下是如何做到这一点:
在groupby中使用diff()
:
# first convert to datetime with the right format
data['time']=pd.to_datetime(data.time, format='%Y-%m-%d %H:%M:%S')
data['tdiff']=(data.groupby('id').diff().time.values/60000000000).astype(int)
data['tdiff'][data['tdiff'] < 0] = np.nan
print(data)
注意-第一行等于6非Nan,需要更改顺序
time id tdiff
0 2012-03-16 23:50:00 1 NaN
1 2012-03-16 23:56:00 1 6.0
2 2012-03-17 00:08:00 1 12.0
3 2012-03-17 00:10:00 2 NaN
4 2012-03-17 00:12:00 2 2.0
5 2012-03-17 00:20:00 2 8.0
6 2012-03-20 00:43:00 3 NaN