Pandas 熊猫:计算[25%和75%范围内的平均值和std
我有以下代码为我的数据帧计算一些聚合:Pandas 熊猫:计算[25%和75%范围内的平均值和std,pandas,Pandas,我有以下代码为我的数据帧计算一些聚合: def percentile(n): def percentile_(x): return np.percentile(x, n) percentile_.__name__ = 'percentile_%s' % n return percentile_ df_type = df[['myType', 'required_time']].groupby(['myType']).agg(['count', 'min'
def percentile(n):
def percentile_(x):
return np.percentile(x, n)
percentile_.__name__ = 'percentile_%s' % n
return percentile_
df_type = df[['myType', 'required_time']].groupby(['myType']).agg(['count', 'min', 'max', 'median', 'mean', 'std', percentile(25), percentile(75)])
代码运行良好。然而,现在我想用[25%和75%的数据来计算平均值和std,在熊猫身上实现这一点最优雅的方法是什么?谢谢 你可以试着用分位数来描述,这对你有用吗
df[['myType', 'required_time']].groupby(['myType']).quantile([0.25,0.5]).describe()
输出:
RandomForestClassifier AdaBoostClassifier GaussianNB
count 2.000000 2.000000 2.000000
mean 0.596761 0.627393 0.580476
std 0.496570 0.463766 0.491389
min 0.245632 0.299462 0.233012
25% 0.421196 0.463427 0.406744
50% 0.596761 0.627393 0.580476
75% 0.772325 0.791359 0.754208
max 0.947889 0.955325 0.927941