Python 大熊猫的计数和回归均值

Python 大熊猫的计数和回归均值,python,pandas,Python,Pandas,我在做泰坦尼克号的卡格尔问题 我试图在同一个查询中针对我的数据集返回count和sum。我知道我必须在查询中的某个地方使用.agg函数,但我不知道在哪里 SexI是一个与乘客性别相关的列,AgeCat是我创建的一个列,用于更好地传达年龄数据: df[['AgeCat', 'SexI', 'PropSurvive']].groupby(['SexI','AgeCat'], as_index=False).agg(['mean', 'count']).sort_values(by=['SexI','

我在做泰坦尼克号的卡格尔问题

我试图在同一个查询中针对我的数据集返回count和sum。我知道我必须在查询中的某个地方使用
.agg
函数,但我不知道在哪里

SexI
是一个与乘客性别相关的列,
AgeCat
是我创建的一个列,用于更好地传达年龄数据:

df[['AgeCat', 'SexI', 'PropSurvive']].groupby(['SexI','AgeCat'], as_index=False).agg(['mean', 'count']).sort_values(by=['SexI','AgeCat'], ascending=True)
因此,在这个查询中,当我用
替换
agg(['mean','count'])
时,mean
返回我想要的结果,这是我正在分析的不同组的生存平均值。当我替换为
.count
时,它返回一个计数

但是我不能让它们在同一个查询中返回。现在它给了我一个关键错误:
'SexI'
,但我真的不知道怎么做

顺便说一句,这类似于SQL查询,您需要
选择count(ROW)&mean(ROW)

我认为需要在
groupby
之后添加列
PropSurvive

(df.groupby(['SexI','AgeCat'])['PropSurvive']
   .agg(['mean', 'count'])
   .reset_index() 
   .sort_values(by=['SexI','AgeCat'], ascending=True))

是否可以添加一些具有预期输出的样本数据?['surved'、'Pclass'、'Name'、'Sex'、'Age'、'SibSp'、'Parch'、'Ticket'、'Fare'、'carb'、'SexI'、'FareCat'、'AgeCat']如果我将.agg(['mean'、'count'])替换为.count或.mean,它可以工作……没有类型。我知道,尝试重置_index@user3042850-存在问题
,因为_index=False
不应返回多索引,但会返回。所以重置索引帮助。