(Python,DataFrame):记录一列中小于n'的所有数字的平均值;第百分位

(Python,DataFrame):记录一列中小于n'的所有数字的平均值;第百分位,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个类似于下面的数据框,希望创建一个更像第二个表的数据框或系列 例如:我会找到A列的第n个百分位,然后取A中小于第n个百分位的所有数字的平均值 我使用了下面的代码来获得每列的平均值和范围,但似乎缺少一些东西来获得条件平均值 min = df.min(axis='index') max = df.max(axis='index') mean = df.mean(axis = 'index') df[df < np.percentile(df, 0.4)].mean() 表2 In

我有一个类似于下面的数据框,希望创建一个更像第二个表的数据框或系列

例如:我会找到A列的第n个百分位,然后取A中小于第n个百分位的所有数字的平均值

我使用了下面的代码来获得每列的平均值和范围,但似乎缺少一些东西来获得条件平均值

min = df.min(axis='index')

max = df.max(axis='index')

mean = df.mean(axis = 'index')

df[df < np.percentile(df, 0.4)].mean()
表2

Index   Avg<40th Percentile
A   3.25
B   1.333333333
C   1.666666667
D   4
E   1.333333333
F   1.666666667
平均指数使用

df.where(df
您能以文本形式发布这些数据吗?图片完全没有帮助。类似
df.apply(lambda x:np.mean(x[x>x.quantile(0.4)])
的东西以更友好的格式添加了数据
Index   Avg<40th Percentile
A   3.25
B   1.333333333
C   1.666666667
D   4
E   1.333333333
F   1.666666667
df.where(df < df.quantile(0.4)).mean()

Date         NaN
A       3.250000
B       1.333333
C       1.666667
D       4.000000
E       1.333333
F       1.666667