Python 如何与大熊猫进行分组和交流?
我有以下类型的数据帧:Python 如何与大熊猫进行分组和交流?,python,pandas,Python,Pandas,我有以下类型的数据帧: Country Year Age Male Female 0 Canada 2005 50 400 25 1 Canada 2005 51 100 25 2 Canada 2006 50 100 70 3 Columbia 2005 50 75 75 例如,我想得到任何年
Country Year Age Male Female
0 Canada 2005 50 400 25
1 Canada 2005 51 100 25
2 Canada 2006 50 100 70
3 Columbia 2005 50 75 75
例如,我想得到任何年龄段的男性+女性的总数,按国家和年份分组。也就是说,我试图理解什么操作可以让我看到一个表,例如
Country Year Total over ages and sexes
0 Canada 2005 550
1 Canada 2006 170
2 Columbia 2005 150
在上面的例子中,值550来自于2005年加拿大的男性和女性总数,无论年龄:因此550=400+25+100+25
我可能需要groupby
Country和Year,但我不确定如何将年龄和男女总数合并
df["Total"] = df.Male + df.Female
df.groupby(["Country", "Year"]).Total.sum()
输出:
Country Year
Canada 2005 550
2006 170
Columbia 2005 150
Name: Total, dtype: int64
更新Cᴏʟᴅsᴘᴇᴇᴅ's链接版本:
(df.assign(Total=df.Male + df.Female)
.groupby(['Country', 'Year'])
.Total
.sum()
.reset_index(name='Total over ages and sexes'))
你能更清楚一点你所说的“崩溃”是什么意思吗?你是如何得到这些数字的?请对计算进行分解,这会有所帮助。我已经对示例进行了扩展。
df.assign(Total=df.Male+df.Female)。groupby(['Country','Year'])。Total.sum()。重置索引(name='Total over ages and gender')