Python 如何提取最佳'；杂质'；节点的值（即基尼指数或熵）？_Python_Scikit Learn_Decision Tree_Entropy_Gini

Python 如何提取最佳'；杂质'；节点的值（即基尼指数或熵）？

python scikit-learn

Python 如何提取最佳'；杂质'；节点的值（即基尼指数或熵）？,python,scikit-learn,decision-tree,entropy,gini,Python,Scikit Learn,Decision Tree,Entropy,Gini,我想知道如何计算Scikit学习库中决策树算法的最优基尼或熵我已经知道如何计算基尼指数，节点的熵信息增益我的重点是“如何通过成本函数或信息增益获得最佳基尼指数或熵？” 基尼指数和熵值是节点分裂的结果因此，如果我想知道最小成本函数值或最高信息增益值，我应该计算所有特征、样本和阈值的杂质指数吗我试图阅读Scikit Learn的github中的拆分器代码网址：我想首先，他们会搜索所有的样本。但似乎有一种方法可以找到最佳标准或价值，但我不确定这一点总之，我有两个问题：在Scikit

我想知道如何计算Scikit学习库中决策树算法的最优基尼或熵

我已经知道如何计算基尼指数，节点的熵信息增益

我的重点是“如何通过成本函数或信息增益获得最佳基尼指数或熵？”

基尼指数和熵值是节点分裂的结果

因此，如果我想知道最小成本函数值或最高信息增益值，我应该计算所有特征、样本和阈值的杂质指数吗

我试图阅读Scikit Learn的github中的拆分器代码

网址：

我想首先，他们会搜索所有的样本。但似乎有一种方法可以找到最佳标准或价值，但我不确定这一点

总之，我有两个问题：

在Scikit学习决策树中计算杂质值时，它真的为每个样本、特征和阈值计算杂质值吗

如果不是，splitter如何不检查所有情况