Python 基于月平均值的缺失小时时点数据的新方法

Python 基于月平均值的缺失小时时点数据的新方法,python,pandas,dataframe,Python,Pandas,Dataframe,我创建了一个每小时空气污染测量的数据框架。有一些缺少的值,我想用月平均值来替换 我根据相同的数据制作了一个月平均值的数据框架: 我如何在原始数据帧上使用fillna方法,以各自月份的平均值填充缺失的数据 考虑df df = pd.DataFrame(dict( date=pd.date_range('2015-04-01', periods=9, freq='5B'), ozone=np.random.rand(9) * np.random.choice((1

我创建了一个每小时空气污染测量的数据框架。有一些缺少的值,我想用月平均值来替换

我根据相同的数据制作了一个月平均值的数据框架:


我如何在原始数据帧上使用fillna方法,以各自月份的平均值填充缺失的数据

考虑
df

df = pd.DataFrame(dict(
        date=pd.date_range('2015-04-01', periods=9, freq='5B'),
        ozone=np.random.rand(9) * np.random.choice((1, np.nan), 9, p=(.6, .4)),
        nox=np.random.rand(9) * np.random.choice((1, np.nan), 9, p=(.6, .4)),
    ))
df

然后用
groupby
transform('mean')


基本上,我想提交相同的文件。但你几乎总是跑得更快^^^效果很好!!
df.fillna(df.groupby(df.date.dt.month).transform('mean'))