在R中有效地使用Boruta包
我的数据集中有一个变量列表,比如v1、v2、v3、v4…v25。我的预测变量是销售额。在使用Boruta软件包进行功能选择时,我写道:在R中有效地使用Boruta包,r,R,我的数据集中有一个变量列表,比如v1、v2、v3、v4…v25。我的预测变量是销售额。在使用Boruta软件包进行功能选择时,我写道: Boruta(Sales ~ ., data=na.omit(df), doTrace=2) 如果我想手动删除一个变量,比如我知道的v1没有任何意义,我写: Boruta(Sales ~ .-v1, data=na.omit(df), doTrace=2) 我应该如何删除多个变量?像v2,v3和v4? 另外,如果我想保留一些变量用于Boruta的检查,比如5
Boruta(Sales ~ ., data=na.omit(df), doTrace=2)
如果我想手动删除一个变量,比如我知道的v1没有任何意义,我写:
Boruta(Sales ~ .-v1, data=na.omit(df), doTrace=2)
我应该如何删除多个变量?像v2,v3和v4?
另外,如果我想保留一些变量用于Boruta的检查,比如50个变量中的20个,可以做什么
请帮忙。博鲁塔使用通常的“公式”格式,对吗?因此,您可以将“-[variable]”链接在一起,直到您费心打字为止,例如
lm(mpg~.-cyl drat,mtcars)
圆点的意思是“一切”,所以如果有更多的东西你想省略,而你想保留,那么就去掉圆点,把东西放进去而不是拿走,例如lm(mpg~cyl+drat,mtcars)
您还可以从字符串创建公式,因此您可以选择让R为您构建公式
vars <- c("cyl","drat")#whatever your process is for getting these
myf <- as.formula(paste0(c("mpg~",vars[1],paste0('+',vars[2:length(vars)])),collapse=""))
lm(formula=myf,mtcars)
vars创建类似myf的公式对象更安全