Python 如何提取最佳';杂质';节点的值(即基尼指数或熵)?

Python 如何提取最佳';杂质';节点的值(即基尼指数或熵)?,python,scikit-learn,decision-tree,entropy,gini,Python,Scikit Learn,Decision Tree,Entropy,Gini,我想知道如何计算Scikit学习库中决策树算法的最优基尼或熵 我已经知道如何计算基尼指数,节点的熵信息增益 我的重点是“如何通过成本函数或信息增益获得最佳基尼指数或熵?” 基尼指数和熵值是节点分裂的结果 因此,如果我想知道最小成本函数值或最高信息增益值,我应该计算所有特征、样本和阈值的杂质指数吗 我试图阅读Scikit Learn的github中的拆分器代码 网址: 我想首先,他们会搜索所有的样本。 但似乎有一种方法可以找到最佳标准或价值,但我不确定这一点 总之,我有两个问题: 在Scikit

我想知道如何计算Scikit学习库中决策树算法的最优基尼或熵

我已经知道如何计算基尼指数,节点的熵信息增益

我的重点是“如何通过成本函数或信息增益获得最佳基尼指数或熵?”

基尼指数和熵值是节点分裂的结果

因此,如果我想知道最小成本函数值或最高信息增益值,我应该计算所有特征、样本和阈值的杂质指数吗

我试图阅读Scikit Learn的github中的拆分器代码

网址:

我想首先,他们会搜索所有的样本。 但似乎有一种方法可以找到最佳标准或价值,但我不确定这一点

总之,我有两个问题:

  • 在Scikit学习决策树中计算杂质值时,它真的为每个样本、特征和阈值计算杂质值吗
  • 如果不是,splitter如何不检查所有情况