Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/322.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 按列和的值分组_Python_Group By_Pandas_Dataframe - Fatal编程技术网

Python 按列和的值分组

Python 按列和的值分组,python,group-by,pandas,dataframe,Python,Group By,Pandas,Dataframe,我在Pandas doc和features中迷失了方向,它们试图找到一种方法,通过列和的值来groupbyaDataFrame 例如,假设我有以下数据: In [2]: dat = {'a':[1,0,0], 'b':[0,1,0], 'c':[1,0,0], 'd':[2,3,4]} In [3]: df = pd.DataFrame(dat) In [4]: df Out[4]: a b c d 0 1 0 1 2 1 0 1 0 3 2 0 0 0

我在Pandas doc和features中迷失了方向,它们试图找到一种方法,通过列和的值来
groupby
a
DataFrame

例如,假设我有以下数据:

In [2]: dat = {'a':[1,0,0], 'b':[0,1,0], 'c':[1,0,0], 'd':[2,3,4]}

In [3]: df = pd.DataFrame(dat)

In [4]: df
Out[4]: 
   a  b  c  d
0  1  0  1  2
1  0  1  0  3
2  0  0  0  4
我希望对
a
b
c
列进行分组,因为它们的总和都等于1。结果数据框的列标签等于它所求和的列的总和。像这样:

   1  9
0  2  2
1  1  3
2  0  4
有什么好主意能让我走上正轨吗?提前谢谢

给你:

In [57]: df.groupby(df.sum(), axis=1).sum()
Out[57]: 
   1  9
0  2  2
1  1  3
2  0  4

[3 rows x 2 columns]

df.sum()。它在0轴(索引)上求和,给出两组:
1
(列
a
b
,和
c
)和
9
(列
d
)。您需要对列进行分组(
axis=1
),并计算每个组的总和。

因为
pandas
在设计时考虑了数据库的概念,所以真正需要的信息是以行而不是列的形式存储在一起。因此,按行操作通常更优雅。以下是如何按行解决您的问题:

dat = {'a':[1,0,0], 'b':[0,1,0], 'c':[1,0,0], 'd':[2,3,4]}
df = pd.DataFrame(dat)

df = df.transpose()
df['totals'] = df.sum(1)

print df.groupby('totals').sum().transpose()
#totals  1  9
#0       2  2
#1       1  3
#2       0  4

哦我认为@tomaugsurger的答案比我的好!(我们一定是在同一时间输入的!)在记住groupby的
axis
参数之前,我的开始方式与您的相同。我想我以前从未使用过它。有没有一部分文档让你感到特别困惑?或者只是很难把医生们说的话翻译成你的问题?如果你有任何改进,一定要与别人分享。再次感谢。