(R) 根据gbm.step绘制BRT模型的树状图

(R) 根据gbm.step绘制BRT模型的树状图,r,plot,tree,dendrogram,gbm,R,Plot,Tree,Dendrogram,Gbm,(之前发布到错误的sub,没有足够的信息,该sub已关闭,我进行了编辑,编辑内容似乎已被删除,并且该帖子已被寄送至炼狱,因此为重新发布表示歉意,我不知道以前的帖子是否可以/应该重新发布) 在R中,我使用dismo运行了一些增强回归树,也称为广义增强模型,它使用gbm。让人们了解我目前所在位置的可复制示例: library(dismo); data(Anguilla_train) angaus.tc5.lr01 <- gbm.step(data=Anguilla_train, gbm.x =

(之前发布到错误的sub,没有足够的信息,该sub已关闭,我进行了编辑,编辑内容似乎已被删除,并且该帖子已被寄送至炼狱,因此为重新发布表示歉意,我不知道以前的帖子是否可以/应该重新发布)

在R中,我使用
dismo
运行了一些增强回归树,也称为广义增强模型,它使用
gbm
。让人们了解我目前所在位置的可复制示例:

library(dismo); data(Anguilla_train)
angaus.tc5.lr01 <- gbm.step(data=Anguilla_train, gbm.x = 3:13, gbm.y = 2, family = "bernoulli", tree.complexity = 5, learning.rate = 0.01, bag.fraction = 0.5)
library(dismo);数据(安圭拉火车)

angaus.tc5.lr01正如您所注意到的,解释决策树集合比解释单个树要困难得多。从几何学上讲,您可以将决策树集合视为复杂、高维曲面的近似。目标是找到有助于近似的变量,并将其效果可视化

解释集合的基本思想不是获取“平均”树,或获取任何单个树的图,而是可视化变量的“平均”效应。在文献中,这是预测值的“部分依赖性”——它的效应保持其他变量不变。如何估计“部分依赖性”有点复杂,但对于观测i而言,这是通过仅允许预测因子j变化而获得的模型隐含预测。然后对所有i观测值进行平均预测。有关血淋淋的详细信息,请参阅

然后,您可以根据预测值的实际值绘制预测值的估计相关性(或我称之为“模型隐含”)效果。这让我们来看看模型隐含的预测效果


好消息是,在
dismo
中可以很容易地获得这样的图。有关单个预测值,请参见
gbm.plot
;有关涉及两个预测值的透视图,请参见
gbm.perspec
。小插曲也提供了一些例子。为了进一步帮助解释模型,
gbm.interactions
提供了一种检测可能的双向或三向交互的方法。有关这方面的更多详细信息,请参阅。

问题在于没有“平均”树,就像没有随机森林的平均树一样。例如,如果第一个节点一半时间在数值变量上分支,另一半时间在分类变量上分支,该怎么办?如果一些范畴分支位于域{A,B,C}上,而另一些位于域{C,D,E}上,该怎么办?没办法,谢谢你,帕特里克。我的论文中已经有了gbm.plots以及我认为足够的各种其他图形,但一位评论员要求我提供树形图。。。即使这个问题没有真正意义!最后我问简·艾利斯她是怎么做到的&她说她只是编了一个单独的例子,因为这个要求没有意义,但人们凭直觉要求它!嘿,呵呵,现在就出版了,所以从现在开始&向上;)这是一个非常有趣的问题,我也希望这样做。不过,现在我明白了,现在就去做吧。你能告诉我如何发展一棵树吗?非常感谢。