Pandas 绘制排名分布的CDF

Pandas 绘制排名分布的CDF,pandas,histogram,distribution,frequency,cdf,Pandas,Histogram,Distribution,Frequency,Cdf,我有一个熊猫数据框,看起来像这样,它是用groupby命令生成的,然后按#个用户进行排序,以获得top X功能组合的用户数 count_28day, Feature1, Feature2, Feature3 5000 a1 b1 c1 1000 a2 b2 c2 50 a3 b3 c3 我试图绘制用户分布的cdf。我

我有一个熊猫数据框,看起来像这样,它是用groupby命令生成的,然后按#个用户进行排序,以获得top X功能组合的用户数

count_28day,  Feature1,   Feature2,  Feature3
5000           a1           b1         c1
1000           a2           b2         c2
50             a3           b3         c3
我试图绘制用户分布的cdf。我不需要知道这些特征。我只想展示的前X个功能组合,将给我90%的总用户

我是用一种非常老套的方式做这件事的

topx = table.count_28day.sort_values(ascending=False).cumsum()/sum(table.count_28day)
ser_cdf = pd.Series(topx.tolist()[1:100], index=pd.Series(range(1,100)))
ser_cdf.plot(drawstyle='steps')

是否有一种更优雅的方法可以使用直方图或ecdf或其他方法来实现此目的?

这是否回答了您的问题?谢谢你的链接。这篇文章展示了如何从原始数据绘制cdf。这里我汇总了排名数据。我不需要创建任何bin,我只需要绘制每个排名的累积百分比。