Python 基于月平均值的缺失小时时点数据的新方法
我创建了一个每小时空气污染测量的数据框架。有一些缺少的值,我想用月平均值来替换 我根据相同的数据制作了一个月平均值的数据框架:Python 基于月平均值的缺失小时时点数据的新方法,python,pandas,dataframe,Python,Pandas,Dataframe,我创建了一个每小时空气污染测量的数据框架。有一些缺少的值,我想用月平均值来替换 我根据相同的数据制作了一个月平均值的数据框架: 我如何在原始数据帧上使用fillna方法,以各自月份的平均值填充缺失的数据 考虑df df = pd.DataFrame(dict( date=pd.date_range('2015-04-01', periods=9, freq='5B'), ozone=np.random.rand(9) * np.random.choice((1
我如何在原始数据帧上使用fillna方法,以各自月份的平均值填充缺失的数据 考虑
df
df = pd.DataFrame(dict(
date=pd.date_range('2015-04-01', periods=9, freq='5B'),
ozone=np.random.rand(9) * np.random.choice((1, np.nan), 9, p=(.6, .4)),
nox=np.random.rand(9) * np.random.choice((1, np.nan), 9, p=(.6, .4)),
))
df
然后用groupby
和transform('mean')
基本上,我想提交相同的文件。但你几乎总是跑得更快^^^效果很好!!
df.fillna(df.groupby(df.date.dt.month).transform('mean'))