Python 按列和的值分组
我在Pandas doc和features中迷失了方向,它们试图找到一种方法,通过列和的值来Python 按列和的值分组,python,group-by,pandas,dataframe,Python,Group By,Pandas,Dataframe,我在Pandas doc和features中迷失了方向,它们试图找到一种方法,通过列和的值来groupbyaDataFrame 例如,假设我有以下数据: In [2]: dat = {'a':[1,0,0], 'b':[0,1,0], 'c':[1,0,0], 'd':[2,3,4]} In [3]: df = pd.DataFrame(dat) In [4]: df Out[4]: a b c d 0 1 0 1 2 1 0 1 0 3 2 0 0 0
groupby
aDataFrame
例如,假设我有以下数据:
In [2]: dat = {'a':[1,0,0], 'b':[0,1,0], 'c':[1,0,0], 'd':[2,3,4]}
In [3]: df = pd.DataFrame(dat)
In [4]: df
Out[4]:
a b c d
0 1 0 1 2
1 0 1 0 3
2 0 0 0 4
我希望对a
、b
和c
列进行分组,因为它们的总和都等于1。结果数据框的列标签等于它所求和的列的总和。像这样:
1 9
0 2 2
1 1 3
2 0 4
有什么好主意能让我走上正轨吗?提前谢谢 给你:
In [57]: df.groupby(df.sum(), axis=1).sum()
Out[57]:
1 9
0 2 2
1 1 3
2 0 4
[3 rows x 2 columns]
df.sum()。它在0轴(索引)上求和,给出两组:1
(列a
,b
,和c
)和9
(列d
)。您需要对列进行分组(axis=1
),并计算每个组的总和。因为pandas
在设计时考虑了数据库的概念,所以真正需要的信息是以行而不是列的形式存储在一起。因此,按行操作通常更优雅。以下是如何按行解决您的问题:
dat = {'a':[1,0,0], 'b':[0,1,0], 'c':[1,0,0], 'd':[2,3,4]}
df = pd.DataFrame(dat)
df = df.transpose()
df['totals'] = df.sum(1)
print df.groupby('totals').sum().transpose()
#totals 1 9
#0 2 2
#1 1 3
#2 0 4
哦我认为@tomaugsurger的答案比我的好!(我们一定是在同一时间输入的!)在记住groupby的axis
参数之前,我的开始方式与您的相同。我想我以前从未使用过它。有没有一部分文档让你感到特别困惑?或者只是很难把医生们说的话翻译成你的问题?如果你有任何改进,一定要与别人分享。再次感谢。