Pandas 按多个实体列分组,并执行滚动平均值和滚动标准差
我有一个“大”的混合数据集。其结构如下所示:Pandas 按多个实体列分组,并执行滚动平均值和滚动标准差,pandas,pandas-groupby,Pandas,Pandas Groupby,我有一个“大”的混合数据集。其结构如下所示: <class 'pandas.core.frame.DataFrame'> RangeIndex: 8667486 entries, 0 to 8667485 Data columns (total 7 columns): src uint16 dst uint16 seq uint64 signal uint8 noise uint8
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8667486 entries, 0 to 8667485
Data columns (total 7 columns):
src uint16
dst uint16
seq uint64
signal uint8
noise uint8
bitrate float32
snr int16
dtypes: float32(1), float64(1), int16(1), uint16(2), uint64(1), uint8(2)
memory usage: 231.4 MB
及
结果是一个多索引数据帧,我不知道如何将其添加到原始数据帧中
我假设,为了滚动平均值的正确性,还必须在代码中的某个地方按序列号排序。如果执行
dfgrouoed.reset_index()
它将返回一个索引数据帧
df.groupby(['src', 'dst', 'bitrate'])[['snr']].rolling(w_size).mean()
df.groupby(['src', 'dst', 'bitrate'])[['snr']].rolling(w_size).std()