Python 从不同的行组中获取统计信息
我已经开始在Python中使用Pandas来解决以下问题: 我有一个excel文件,里面有所有鸟类的质量值。因此,基本上有两列:“订单名称”和“质量值”。我想做的是获得每种鸟类的质量统计数据(我猜是用.descripe()吧),并以某种方式存储它们 到目前为止,我已经尝试创建一个以不同顺序作为列的数据框架,然后尝试获取每个数据框架的所有质量值,但后来我发现索引不匹配这一事实存在一些问题。我是Python新手,所以我对任何想法都非常开放:) 谢谢 蒂亚戈 收益率(类似于)Python 从不同的行组中获取统计信息,python,pandas,statistics,Python,Pandas,Statistics,我已经开始在Python中使用Pandas来解决以下问题: 我有一个excel文件,里面有所有鸟类的质量值。因此,基本上有两列:“订单名称”和“质量值”。我想做的是获得每种鸟类的质量统计数据(我猜是用.descripe()吧),并以某种方式存储它们 到目前为止,我已经尝试创建一个以不同顺序作为列的数据框架,然后尝试获取每个数据框架的所有质量值,但后来我发现索引不匹配这一事实存在一些问题。我是Python新手,所以我对任何想法都非常开放:) 谢谢 蒂亚戈 收益率(类似于) 因此,只需将'A'更改为
因此,只需将
'A'
更改为'Order Name'
,将B
更改为'Mass Value'
您能否分享更多细节(错误和代码)您能否添加数据样本和所需输出?最好的是。哇,太谢谢你了!很抱歉,我没有提供更多的信息。但这正是我想要的!
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(10, size=(20, 2)), columns=list('AB'))
result = df.groupby('A')['B'].describe().unstack()
count mean std min 25% 50% 75% max
A
0 5.0 6.800000 1.923538 4.0 6.00 7.0 8.00 9.0
1 3.0 5.333333 4.725816 0.0 3.50 7.0 8.00 9.0
4 3.0 2.666667 1.154701 2.0 2.00 2.0 3.00 4.0
5 2.0 3.000000 1.414214 2.0 2.50 3.0 3.50 4.0
6 1.0 4.000000 NaN 4.0 4.00 4.0 4.00 4.0
7 2.0 5.500000 2.121320 4.0 4.75 5.5 6.25 7.0
8 3.0 2.333333 2.081666 0.0 1.50 3.0 3.50 4.0
9 1.0 7.000000 NaN 7.0 7.00 7.0 7.00 7.0