Python 如何使用SciKit随机林';学习曲线的oob_决策函数?

Python 如何使用SciKit随机林';学习曲线的oob_决策函数?,python,scikit-learn,random-forest,Python,Scikit Learn,Random Forest,有人能解释一下如何为python SciKit随机林分类器使用oob_decision_function_属性吗?我想用它来绘制学习曲线,将训练和验证误差与不同的训练集大小进行比较,以便识别过拟合和其他问题。似乎找不到有关如何执行此操作的任何信息。您可以将自定义评分函数传递到模型求值字段中的任何评分参数中,它需要有符号分类器,X,y\u true->score 对于您的情况,您可以使用以下内容 from sklearn.learning_curve import learning_curve l

有人能解释一下如何为python SciKit随机林分类器使用oob_decision_function_属性吗?我想用它来绘制学习曲线,将训练和验证误差与不同的训练集大小进行比较,以便识别过拟合和其他问题。似乎找不到有关如何执行此操作的任何信息。

您可以将自定义评分函数传递到模型求值字段中的任何
评分
参数中,它需要有符号
分类器,X,y\u true->score

对于您的情况,您可以使用以下内容

from sklearn.learning_curve import learning_curve
learning_curve(r, X, y, cv=3, scoring=lambda c,x,y: c.oob_score_)
这将根据不同的训练集大小计算3倍交叉验证的oob分数。顺便说一句,我认为你不应该过度适应随机森林,这是它们的好处之一