Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/291.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何解释h2o决策树?_Python_Machine Learning_Decision Tree_H2o - Fatal编程技术网

Python 如何解释h2o决策树?

Python 如何解释h2o决策树?,python,machine-learning,decision-tree,h2o,Python,Machine Learning,Decision Tree,H2o,我绘制了一个h2o决策树: 我跟随了很多关于SO的帖子,如果我错了,请纠正我,但是叶子上的值是相关性,级别是分类值的计数,树0表示创建的第一棵树。 现在我的问题是 1.我无法计算出分类值中的大于或等于符号和小于符号。例如,如果我们在Z之后继续,如果您正在构建一个简单的决策树,那么叶节点上的值是输出概率,而不是相关性,并且级别不是分类值的计数,因为您可以在不同级别的树中重复多个特征。级别由训练模型时提供的深度决定 “大于”或“小于”标志表示您必须前往的方向。例如,在级别1,如果z>10.0325,

我绘制了一个h2o决策树: 我跟随了很多关于SO的帖子,如果我错了,请纠正我,但是叶子上的值是相关性,级别是分类值的计数,树0表示创建的第一棵树。 现在我的问题是
1.我无法计算出分类值中的大于或等于符号和小于符号。例如,如果我们在Z之后继续,如果您正在构建一个简单的决策树,那么叶节点上的值是输出概率,而不是相关性,并且级别不是分类值的计数,因为您可以在不同级别的树中重复多个特征。级别由训练模型时提供的深度决定

“大于”或“小于”标志表示您必须前往的方向。例如,在级别1,如果z>10.0325,则向右移动,但如果z>10.0325,则在树中向左移动。NA基本上表示,若值小于阈值或为空,则向左移动。您的模型在数值上考虑了分类变量,H2O为您提供了使用分类_编码改变这一点的选项。由于数据为数字格式,因此被解释为数字格式

再次出现决策1的原因是因为您的模型正在检查不同的特征以验证结果。如果第一级失败,并且模型对输出不确定,它将检查第二级并执行相同的操作,然后继续向下树,直到达到预测


你说的高度由深度决定是什么意思?该模型有200个分类变量,因此很明显,第一个节点的每侧有100个,最后一个节点有96个和4个。那么c的概率1或z>10.0325的概率1意味着什么?这不是决策树的工作原理。。。从提供的图像中,根的右子树在第一级结束。您可以从树中看到,模型检查z是否有更大的阈值,如果失败,它将检查z是否有更小的阈值,如果仍然失败,则预测值为0.0,否则它将检查c并进行最终预测。几乎完成了,谢谢!如果你看最后一级,左边是96级,右边是4级,96级意味着什么?模型是否检查c,如果它有这4个分类,概率为1,如果它的c有96个其他分类,概率为0?这是你的问题二元分类,你是否为每个类建立一棵树。在这种情况下,概率的含义会发生变化,但其余的则保持不变。所以,核实一下。如果要构建多棵树,则叶值将显示预测属于该类的概率。