Python 如何在熊猫中使用groupby?
我有一个全年每分钟的timeseries数据Python 如何在熊猫中使用groupby?,python,pandas,dataframe,datetime,time-series,Python,Pandas,Dataframe,Datetime,Time Series,我有一个全年每分钟的timeseries数据 timestamp day hour min somedata 2010-01-01 00:00:00 1 0 0 x 2010-01-01 00:01:00 1 0 1 x 2010-01-01 00:02:00 1 0 2 x 2010-01-01 00:03:00 1 0 3 x 20
timestamp day hour min somedata
2010-01-01 00:00:00 1 0 0 x
2010-01-01 00:01:00 1 0 1 x
2010-01-01 00:02:00 1 0 2 x
2010-01-01 00:03:00 1 0 3 x
2010-01-01 00:04:00 1 0 4 x
... ...
2010-12-31 23:55:00 365 23 55
2010-12-31 23:56:00 365 23 56
2010-12-31 23:57:00 365 23 57
2010-12-31 23:58:00 365 23 58
2010-12-31 23:59:00 365 23 59
我想根据日期对数据进行分组,即2010-01-01
数据应该是一组,2010-01-02
应该是另一组,直到2010-12-31
我使用了daily\u groupby=dataframe.groupby(pd.to\u datetime(dataframe.index.day,unit='D',origin=pd.Timestamp('2009-12-31'))
。这将根据天数创建组,因此所有的1月、2月至12月1日都在一个组中。但我也希望使用月份进行分组,这样就不会混淆jan,feb..
。
我是熊猫的初学者。如果时间戳
是索引使用
否则
如果您不想按年份分组,请使用:
time_index = pd.to_datetime(df.index)
df.groupby([time_index.month,time_index.day])
如果时间戳
是索引使用
否则
如果您不想按年份分组,请使用:
time_index = pd.to_datetime(df.index)
df.groupby([time_index.month,time_index.day])
这里实际上时间戳是索引。这里实际上时间戳是索引。
time_index = pd.to_datetime(df.index)
df.groupby([time_index.month,time_index.day])