Python 需要根据数据列中的月份使用熊猫对数据进行分组
我想根据一月和二月对数据进行分组。这是我拥有的数据集的一个示例Python 需要根据数据列中的月份使用熊猫对数据进行分组,python,pandas,datatables,dataset,pandas-groupby,Python,Pandas,Datatables,Dataset,Pandas Groupby,我想根据一月和二月对数据进行分组。这是我拥有的数据集的一个示例 Date Count 01.01.2019 1 01.02.2019 7 02.01.2019 4 03.01.2019 4 04.01.2019 1 04.02.2019 5 我想将数据分组如下,其中总计数是基于第1个月(1月)和第2个月(2月)的计数的总和: 强制转换到日期时间,按和分组: 要按月份对索引进行排序,
Date Count
01.01.2019 1
01.02.2019 7
02.01.2019 4
03.01.2019 4
04.01.2019 1
04.02.2019 5
我想将数据分组如下,其中总计数是基于第1个月(1月)和第2个月(2月)的计数的总和:
强制转换到日期时间,按和分组:
要按月份对索引进行排序,我们可以执行以下操作:
s = df.groupby(pd.to_datetime(df['Date-'], format='%d.%m.%Y-').dt.month)['Count'].sum()
s.index = pd.to_datetime(s.index, format='%m').month_name().str[:3]
s.rename_axis('Month').reset_index(name='Total_Count')
Month Total_Count
0 Jan 10
1 Feb 12
不,没有。我很抱歉欢迎你@VishvamNaik别忘了你可以投票并接受答案。看,谢谢!我对此有点怀疑。如何通过在进一步的代码中调用来将列添加到此数据帧中?如果可以更好地避免,通常@vishvam不是一个好的做法。最好的方法是只计算一次,就这样。附加到df不是一个好主意。
(df.groupby(pd.to_datetime(df['Date'], format='%d.%m.%Y')
.dt.month_name()
.str[:3])['Count']
.sum()
.rename_axis('Month')
.reset_index(name='Total_Count'))
Month Total_Count
0 Feb 12
1 Jan 10
s = df.groupby(pd.to_datetime(df['Date-'], format='%d.%m.%Y-').dt.month)['Count'].sum()
s.index = pd.to_datetime(s.index, format='%m').month_name().str[:3]
s.rename_axis('Month').reset_index(name='Total_Count')
Month Total_Count
0 Jan 10
1 Feb 12