Graphviz 提升树的值的含义是什么?

Graphviz 提升树的值的含义是什么?,graphviz,decision-tree,xgboost,Graphviz,Decision Tree,Xgboost,我画了一棵树,在树的末端(叶子中)显示了一些值。它们是什么意思 # model parameters colsample_bytree = 0.4 objective = 'binary:logistic' learning_rate = 0.05 eval_metric = 'auc' max_depth = 8 min_child_weight = 4 n_estimators = 5000 seed = 7 # create and train model bst = xgb.train

我画了一棵树,在树的末端(叶子中)显示了一些值。它们是什么意思

# model parameters
colsample_bytree = 0.4
objective = 'binary:logistic'
learning_rate = 0.05
eval_metric = 'auc'
max_depth = 8
min_child_weight = 4
n_estimators = 5000
seed = 7

# create and train model
bst = xgb.train(param, 
                dtrain, 
                num_boost_round = best_iteration)

dot = xgb.to_graphviz(bst, rankdir='LR')
dot.render("trees1")
我想,这是一个预测的proba分数,但叶子的“值”范围高达0.01。而预测的proba分数范围高达1。可能是,它意味着预测概率分数除以10(例如,叶值=0.01意味着预测概率=0.1)

为什么有些叶子有负值(例如-0.01)? 多谢各位


叶的值是您的“评估指标”,位于您的分割:)。对你来说,这就是AUC

以下是树的所有属性:

n_nodes = estimator.tree_.node_count
children_left = estimator.tree_.children_left
children_right = estimator.tree_.children_right
feature = estimator.tree_.feature
threshold = estimator.tree_.threshold
从文件:


在文档中找不到它,但“树杂质”也确实存在。

Gwendal,我已尝试将auc度量更改为log loss和其他度量。叶节点-中的值相等。我试图学习文档,但没有发现如何理解——在树的末尾预测了什么类,或者预测了什么概率?将非常感谢您的帮助。每个结束页都是初始总体的一部分,分配给单个结果。此字段匹配所有分支拆分,意味着再次匹配这些拆分的每个新数据将获得相同的值。这是一个很好的例子,每个端点节点,叶,都包含一个类属性,这是分配给resultGwendal的填充,谢谢。我对你的理解是对的,每片叶子都是整个种群的一部分。这意味着summa中的所有叶值都将给出-1?在注释中链接的图表中,每个叶中都有预测类。如何将预测类添加到每个叶中?在我的图片示例中。所有叶片样本等于第一个叶片样本。关于您的值,因为您的度量是AUC。我猜这是叶群的AUC,也就是给定样本的模型性能。与预测值无关:)。需要在文档中检查。我想我对树表示的理解到此为止。我可能给了错误的见解:对不起,亚历克斯