Variables Rpart-变量重要性向量-如何?
我在互联网上搜索了一段时间,以了解rpart在变量重要性输出中分配给变量的数字“排名”统计 我知道这个数字加上100,但它到底是什么,它叫什么,它代表什么Variables Rpart-变量重要性向量-如何?,variables,rpart,Variables,Rpart,我在互联网上搜索了一段时间,以了解rpart在变量重要性输出中分配给变量的数字“排名”统计 我知道这个数字加上100,但它到底是什么,它叫什么,它代表什么 我发现,在过去,将许多分类列排序为一个连续的目标变量是非常有用的它是为每个变量单独计算的,并且该值是作为杂质减少的总和计算的,当变量显示为主要分割时,以及当它显示为代理时,它都计算在内。然后将其转换为百分比评分,最高值为100,并连续成比例,直到较低的值。 在这里,您可以更好地了解变量重要性的含义: 和Breiman的书(分类和回归树) 希望
我发现,在过去,将许多分类列排序为一个连续的目标变量是非常有用的它是为每个变量单独计算的,并且该值是作为杂质减少的总和计算的,当变量显示为主要分割时,以及当它显示为代理时,它都计算在内。然后将其转换为百分比评分,最高值为100,并连续成比例,直到较低的值。 在这里,您可以更好地了解变量重要性的含义: 和Breiman的书(分类和回归树) 希望这有帮助