使用交叉验证时,是否有方法确保每个折叠至少包含几个true类的实例?
我正在使用带插入符号的交叉折叠验证来拟合模型:使用交叉验证时,是否有方法确保每个折叠至少包含几个true类的实例?,r,logistic-regression,R,Logistic Regression,我正在使用带插入符号的交叉折叠验证来拟合模型: library(caret) ## tuning & parameters set.seed(123) train_control <- trainControl( method = "cv", number = 5, savePredictions = TRUE, verboseIter = TRUE, classProbs = TRUE, summaryFunction = my_summary ) l
library(caret)
## tuning & parameters
set.seed(123)
train_control <- trainControl(
method = "cv",
number = 5,
savePredictions = TRUE,
verboseIter = TRUE,
classProbs = TRUE,
summaryFunction = my_summary
)
linear_model = train(
x = select(training_data, Avg_Load_Time),
y = target,
trControl = train_control,
method = "glm", # logistic regression
family = "binomial",
metric = "ROC"
)
库(插入符号)
##调谐与参数
种子集(123)
训练控制当你洗牌数据并且每个类都有足够的例子时,它会更容易
如果没有足够的示例,可以使用SMOTE(合成少数过采样技术)增加少数类的大小。包装smotefamily
在右侧
然后,您将能够在不引发任何问题的情况下进行5到10次交叉验证。当您洗牌数据并且每个类都有足够的示例时,会更容易
如果没有足够的示例,可以使用SMOTE(合成少数过采样技术)增加少数类的大小。包装smotefamily
在右侧
然后,您将能够进行5到10倍的交叉验证,而不会引发任何问题