Pandas 熊猫0.25.0:分类上的groupby

Pandas 熊猫0.25.0:分类上的groupby,pandas,pandas-groupby,Pandas,Pandas Groupby,我在使用上个月发布的Pandas 0.25.0时遇到了一些困难 考虑一下这个日期框架: df=pd.DataFrame({ 'A':pd.系列(['A','b','b','A'],dtype='category'), 'B':pd.系列(['m','o','o','o']), “C”:pd.级数([1,2,3,4]), }) 假设我们想在前两列上分组。结果数据框应包含3行,因为组合bm不存在 df.groupby(['A','B']).agg({'C':'sum'}) 在Pandas 0.2

我在使用上个月发布的Pandas 0.25.0时遇到了一些困难

考虑一下这个日期框架:

df=pd.DataFrame({
'A':pd.系列(['A','b','b','A'],dtype='category'),
'B':pd.系列(['m','o','o','o']),
“C”:pd.级数([1,2,3,4]),
})
假设我们想在前两列上分组。结果数据框应包含3行,因为组合
b
m
不存在

df.groupby(['A','B']).agg({'C':'sum'})
在Pandas 0.24.1及更早版本中,这可以正常工作:

C
A B
m 1
o 4
b o 5
但是,在熊猫0.25.0中,这一点被打破:

C
A B
m 1.0
o 4.0
b男
o 5.0
我知道我可以通过向groupby调用添加
observed=True
来抑制这种不必要的行为,但在旧版本中这不是必需的。我找不到与此相关的任何内容

为什么?这是熊猫身上的虫子吗?我错过了什么吗?

多亏了我想我知道发生了什么:


我(不知不觉地)依赖于0.24中的一个bug,这就是为什么0.25的更新破坏了我的代码。

在0.25的版本中,在“bug in Series.groupby()中,观察到的kwarg以前被忽略了”下有一行