Python 在聚合字典中指定百分位数
我正在使用聚合字典总结变量“CSC130”,并有一个关于如何获得25%和75%值的问题 文档中提到了分位数摘要函数,但我看不到如何使用它的语法 如何使用此字典添加一行以获取“CSC130”的第25百分位值 非常感谢Python 在聚合字典中指定百分位数,python,pandas,Python,Pandas,我正在使用聚合字典总结变量“CSC130”,并有一个关于如何获得25%和75%值的问题 文档中提到了分位数摘要函数,但我看不到如何使用它的语法 如何使用此字典添加一行以获取“CSC130”的第25百分位值 非常感谢 aggregations = { 'CSC130': { 'CSC130_sum': 'sum', 'CSC130_mean': 'mean', 'CSC130_min': 'min', 'CSC130_m
aggregations = {
'CSC130': {
'CSC130_sum': 'sum',
'CSC130_mean': 'mean',
'CSC130_min': 'min',
'CSC130_max': 'max',
'CSC130_count': 'count',
'CSC130_size': 'size',
'CSC130_range': lambda x: max(x) - min(x),
'CSC130_npmean': lambda x: np.mean(x),
'CSC130_median': 'median'
}
}
sumry = df.groupby(['POSTCODE']).agg(aggregations)
语法很简单
yourseries.quantile(yourquantile)
所以只需添加这些行-
'CSC130_25quant': lambda x : x.quantile(0.25)
'CSC130_75quant': lambda x : x.quantile(0.75)
不过我注意到,在处理时间方面,与包含的lambda函数的差异是巨大的。4M记录1.22分钟。vs不到一秒钟,没有lambda函数。有没有更快的办法。我们可以让descripe()函数在没有lambda的情况下提供百分比数据吗?又是thx。