在R中保存分类变量治疗计划
R包在R中保存分类变量治疗计划,r,R,R包vtreat提供了一种为分类变量创建“一个热编码器”的简便方法(请参阅上的相关文章)。是否有任何方法保存治疗计划tplan对象以供进一步使用(例如,Python中pickle的等效机制) tplanBase R为此目的提供了常规函数save()和load() 下面是一个可复制的示例,使用您链接到的帖子中的代码片段: library(titanic) library(vtreat) data(titanic_train) outcome <- 'Survived' target &l
vtreat
提供了一种为分类变量创建“一个热编码器”的简便方法(请参阅上的相关文章)。是否有任何方法保存治疗计划tplan
对象以供进一步使用(例如,Python中pickle
的等效机制)
tplanBase R为此目的提供了常规函数save()
和load()
下面是一个可复制的示例,使用您链接到的帖子中的代码片段:
library(titanic)
library(vtreat)
data(titanic_train)
outcome <- 'Survived'
target <- 1
shouldBeCategorical <- c('PassengerId', 'Pclass', 'Parch')
for(v in shouldBeCategorical) {
titanic_train[[v]] <- as.factor(titanic_train[[v]])
}
tooDetailed <- c("Ticket", "Cabin", "Name", "PassengerId")
vars <- setdiff(colnames(titanic_train), c(outcome, tooDetailed))
dTrain <- titanic_train
set.seed(4623762)
tplan <- vtreat::designTreatmentsZ(dTrain, vars,
minFraction= 0,
verbose=FALSE)
save(tplan, file='tplan.RData')
您将获得tplan
变量
或者,基本R函数saveRDS
和loadRDS
也将执行此任务;它们的用法是完全相似的,而且它们是相同的
library(titanic)
library(vtreat)
data(titanic_train)
outcome <- 'Survived'
target <- 1
shouldBeCategorical <- c('PassengerId', 'Pclass', 'Parch')
for(v in shouldBeCategorical) {
titanic_train[[v]] <- as.factor(titanic_train[[v]])
}
tooDetailed <- c("Ticket", "Cabin", "Name", "PassengerId")
vars <- setdiff(colnames(titanic_train), c(outcome, tooDetailed))
dTrain <- titanic_train
set.seed(4623762)
tplan <- vtreat::designTreatmentsZ(dTrain, vars,
minFraction= 0,
verbose=FALSE)
save(tplan, file='tplan.RData')
load('tplan.RData')