Python 从不同的行组中获取统计信息_Python_Pandas_Statistics

Python 从不同的行组中获取统计信息

python pandas statistics

Python 从不同的行组中获取统计信息,python,pandas,statistics,Python,Pandas,Statistics,我已经开始在Python中使用Pandas来解决以下问题：我有一个excel文件，里面有所有鸟类的质量值。因此，基本上有两列：“订单名称”和“质量值”。我想做的是获得每种鸟类的质量统计数据（我猜是用.descripe（）吧），并以某种方式存储它们到目前为止，我已经尝试创建一个以不同顺序作为列的数据框架，然后尝试获取每个数据框架的所有质量值，但后来我发现索引不匹配这一事实存在一些问题。我是Python新手，所以我对任何想法都非常开放：）谢谢蒂亚戈收益率（类似于）因此，只需将'A'更改为

我已经开始在Python中使用Pandas来解决以下问题：

我有一个excel文件，里面有所有鸟类的质量值。因此，基本上有两列：“订单名称”和“质量值”。我想做的是获得每种鸟类的质量统计数据（我猜是用.descripe（）吧），并以某种方式存储它们

到目前为止，我已经尝试创建一个以不同顺序作为列的数据框架，然后尝试获取每个数据框架的所有质量值，但后来我发现索引不匹配这一事实存在一些问题。我是Python新手，所以我对任何想法都非常开放：）

谢谢

蒂亚戈

收益率（类似于）

因此，只需将

'A'

更改为

'Order Name'

，将

更改为

'Mass Value'

您能否分享更多细节（错误和代码）您能否添加数据样本和所需输出？最好的是。哇，太谢谢你了！很抱歉，我没有提供更多的信息。但这正是我想要的！

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randint(10, size=(20, 2)), columns=list('AB'))
result = df.groupby('A')['B'].describe().unstack()

   count      mean       std  min   25%  50%   75%  max
A                                                      
0    5.0  6.800000  1.923538  4.0  6.00  7.0  8.00  9.0
1    3.0  5.333333  4.725816  0.0  3.50  7.0  8.00  9.0
4    3.0  2.666667  1.154701  2.0  2.00  2.0  3.00  4.0
5    2.0  3.000000  1.414214  2.0  2.50  3.0  3.50  4.0
6    1.0  4.000000       NaN  4.0  4.00  4.0  4.00  4.0
7    2.0  5.500000  2.121320  4.0  4.75  5.5  6.25  7.0
8    3.0  2.333333  2.081666  0.0  1.50  3.0  3.50  4.0
9    1.0  7.000000       NaN  7.0  7.00  7.0  7.00  7.0