“方差分析”(对于lm)是否与rpart对象等效?

“方差分析”(对于lm)是否与rpart对象等效?,r,tree,regression,rpart,cart-analysis,R,Tree,Regression,Rpart,Cart Analysis,当使用R的rpart函数时,我可以很容易地用它来拟合模型。例如: # Classification Tree with rpart library(rpart) # grow tree fit <- rpart(Kyphosis ~ Age + Number + Start, method="class", data=kyphosis) printcp(fit) # display the results plotcp(fit) summary(fit) # detai

当使用R的rpart函数时,我可以很容易地用它来拟合模型。例如:

# Classification Tree with rpart
library(rpart)

# grow tree 
fit <- rpart(Kyphosis ~ Age + Number + Start,
     method="class", data=kyphosis)

printcp(fit) # display the results 
plotcp(fit) 
summary(fit) # detailed summary of splits

# plot tree 
plot(fit, uniform=TRUE, 
     main="Classification Tree for Kyphosis")
text(fit, use.n=TRUE, all=TRUE, cex=.8)
我的问题是— 我如何衡量我的三个解释变量年龄、数字和开始对模型的重要性

如果这是一个回归模型,我可以从有变量和无变量的lm模型之间的方差分析F检验中查看p值。但对lm使用方差分析与rpart对象的等价性是什么

我希望我能把问题说清楚


谢谢。

当然,方差分析是不可能的,因为方差分析包括计算响应变量的总变化量,并将其划分为信息成分SSA、SSE。我看不出如何计算像脊柱后凸这样的分类变量的平方和

我认为你们实际上谈论的是属性选择或评估。例如,我会使用信息增益度量。我认为这是用来选择树中每个节点上的测试属性的,并且具有最高信息增益或最大熵减少的属性被选择为当前节点的测试属性。该属性最小化了对结果分区中的样本进行分类所需的信息

我不知道是否有一种根据属性在R中的信息增益对属性进行排序的方法,但我知道在R中有一种方法,它通过测量类的信息增益来评估属性的价值。如果使用Ranker作为搜索方法,则属性将根据其各自的评估进行排序

编辑 我终于找到了一种使用库CORElearn在R中实现这一点的方法


谢谢gd047,这是一个非常有用的方向!我期待着其他人的想法。谢谢Talgd047,我只是四处寻找信息增益度量的R实现——我似乎找不到任何人在谈论它。也许我会把R和wekka联系起来。再次感谢你的领导!塔尔
estInfGain <- attrEval(Kyphosis ~ ., kyphosis, estimator="InfGain")
print(estInfGain)