Python &引用;“楼梯踏步”;验证图

Python &引用;“楼梯踏步”;验证图,python,numpy,pandas,ipython,Python,Numpy,Pandas,Ipython,我在ipython/scikit中构建了一个随机森林模型 # Tune Random Forest from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier(n_estimators=500,n_jobs=-1) # fit the model model.fit(X, Y, sample_weight=sample_weight) # predict probabilities mod

我在ipython/scikit中构建了一个随机森林模型

# Tune Random Forest
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(n_estimators=500,n_jobs=-1)
# fit the model
model.fit(X, Y, sample_weight=sample_weight)

# predict probabilities
model_probs = model.predict_proba(X)
# break out only the event prob
event_probs = model_probs[:,1]
我能够运行交叉验证的准确性、精确性、召回率、F1分数和ROC/AUC图,但我想做的是创建一个显示以下内容的图表:

“当我预测概率为0-10%时,该垃圾箱的事件实际发生率为5%。预测的10-20%为15%……90-100%为92%。”

理想情况下,我的模型将显示一个完美的“阶梯”,表明当我预测事件发生的可能性更大时,它实际上发生的频率更高

我已经能够通过以下方式“存储”数据:

bins = pd.cut(event_probs,bins=10,labels=False)
但我真的不知道该怎么办


如何构建数据帧/绘图

你可以用每个箱子的实际概率做一个预测概率的散点图。布伦巴恩-谢谢。听起来值得一试-你能给我一个代码示例吗?(我将从R移到R,因此一个例子将真正帮助我学习。)我想如果我仔细思考一下。。因为Y是二进制的(1和0),所以每个箱子的Y/计数之和将是出现的百分比。现在怎么做呢?