Scikit learn 随机森林如何计算scikit学习中的包外错误? scikit是否学习根据每棵树的精度计算oob误差,然后将其平均 或者scikit learn是否先执行一些查找,然后计算后文中提到的真实泛化错误 如果启用了oob_分数(如RandomForestClass

Scikit learn 随机森林如何计算scikit学习中的包外错误? scikit是否学习根据每棵树的精度计算oob误差,然后将其平均 或者scikit learn是否先执行一些查找,然后计算后文中提到的真实泛化错误 如果启用了oob_分数(如RandomForestClass,scikit-learn,random-forest,Scikit Learn,Random Forest,随机森林如何计算scikit学习中的包外错误? scikit是否学习根据每棵树的精度计算oob误差,然后将其平均 或者scikit learn是否先执行一些查找,然后计算后文中提到的真实泛化错误 如果启用了oob_分数(如RandomForestClassifier和BaggingClassifier),随机林是否仍使用软投票(默认选项)形成预测规则?我这样问是因为如果预测是建立在软投票的基础上的,但是oob错误是基于硬投票的(不是基于概率的),那么它是不一致的imho 假设这些都是未记录的,找

随机森林如何计算scikit学习中的包外错误?
  • scikit是否学习根据每棵树的精度计算oob误差,然后将其平均
  • 或者scikit learn是否先执行一些查找,然后计算后文中提到的真实泛化错误
  • 如果启用了
    oob_分数
    (如
    RandomForestClassifier
    BaggingClassifier
    ),随机林是否仍使用软投票(默认选项)形成预测规则?我这样问是因为如果预测是建立在软投票的基础上的,但是oob错误是基于硬投票的(不是基于概率的),那么它是不一致的imho

  • 假设这些都是未记录的,找到自己答案的最快方法是查看sklearn源代码和/或训练一个快速示例RF并检查其结果和分数。@smci是的,我有时间时会看一看。但是如果你知道答案,请随时回答/评论这个问题!基于Andreas Mueller(core sklearn developer)的观点,我假设每次观察都会使用未使用该观察的树进行预测,并对其进行平均。@ayhan:但这正是“现成”的定义。在看了另一个问题后,我将标题编辑为“2.或者scikit learn是否先执行一些查找”是不必要的含糊。doc说OOB平均值(每个样本的wrt)只在没有使用该样本的树上计算。就这样。