Python 绘制按特定日期范围分组的每列平均值
我有7列数据,按日期时间(30分钟频率)索引,从2017年5月31日开始,到2018年5月25日结束。我想画出具体日期(季节)范围的平均值。我一直在尝试groupby,但无法按特定范围访问group。如果我使用df.groupby(df.date.dt.month.mean(),我会得到错误的结果 数据集中的几行(日期范围为2017-05-31至2018-05-25) 我已经创建了这些变量(这些是我需要的范围) 将它们连接起来:Python 绘制按特定日期范围分组的每列平均值,python,python-3.x,pandas,matplotlib,plot,Python,Python 3.x,Pandas,Matplotlib,Plot,我有7列数据,按日期时间(30分钟频率)索引,从2017年5月31日开始,到2018年5月25日结束。我想画出具体日期(季节)范围的平均值。我一直在尝试groupby,但无法按特定范围访问group。如果我使用df.groupby(df.date.dt.month.mean(),我会得到错误的结果 数据集中的几行(日期范围为2017-05-31至2018-05-25) 我已经创建了这些变量(这些是我需要的范围) 将它们连接起来: df_seasons =pd.concat([increment_
df_seasons =pd.concat([increment_rates_winter,increment_rates_spring,increment_rates_summer,increment_rates_fall],axis=1)
经过策划,我得到了:
然而,我一直在努力做到这一点:
x中的季节以及为每列绘制的平均值
Winter = df['2017-06-01':'2017-08-30']
Spring = df['2017-09-01':'2017-11-30']
Summer = df['2017-12-01':'2018-02-28']
Fall = df['2018-03-01':'2018-05-30']
提前谢谢你 转换它怎么样:
df_seasons.T.plot()
输出:
我们可以通过以下方式获得一个特定的日期范围,然后您可以根据需要定义它并取其平均值
将熊猫作为pd导入
df=pd.read\u csv('test.csv'))
df['date']=pd.to_datetime(df['date'])
开始日期=“2017-12-31 09:00:00”
end_date=“2018-04-30 23:00:00”
mask=(df['date']>start_date)&(df['date']我想这会对你有所帮助:我以前读过,太复杂了,不完全是我需要的。但是谢谢你!
df_seasons
Out[664]:
Winter Spring Summer Fall
50 6.697123 6.948447 -1.961549 7.662622
51 6.428329 4.760650 -2.188402 5.927087
52 5.580953 6.667529 1.136889 12.939295
53 6.406259 2.506279 -2.105125 6.964549
54 4.332826 3.678492 -2.574769 6.569398
56 2.222032 3.359607 -2.694863 5.348258
58 NaN 1.388535 -0.035889 4.213046
Winter = df['2017-06-01':'2017-08-30']
Spring = df['2017-09-01':'2017-11-30']
Summer = df['2017-12-01':'2018-02-28']
Fall = df['2018-03-01':'2018-05-30']
df_seasons.T.plot()
date 50 ... 58
8 2017-12-31 09:30:00 212.926846 ... 187.179987 NaN
9 2018-03-31 23:00:00 213.304498 ... 186.887548 NaN
10 2018-03-31 23:30:00 213.308369 ... 186.891422 NaN
11 2018-04-30 23:00:00 215.496812 ... 188.104749 NaN