使用交叉验证时,是否有方法确保每个折叠至少包含几个true类的实例?

使用交叉验证时,是否有方法确保每个折叠至少包含几个true类的实例?,r,logistic-regression,R,Logistic Regression,我正在使用带插入符号的交叉折叠验证来拟合模型: library(caret) ## tuning & parameters set.seed(123) train_control <- trainControl( method = "cv", number = 5, savePredictions = TRUE, verboseIter = TRUE, classProbs = TRUE, summaryFunction = my_summary ) l

我正在使用带插入符号的交叉折叠验证来拟合模型:

library(caret)

## tuning & parameters
set.seed(123)
train_control <- trainControl(
  method = "cv",
  number = 5,
  savePredictions = TRUE,
  verboseIter = TRUE,
  classProbs = TRUE,
  summaryFunction = my_summary
)

linear_model = train(
  x = select(training_data, Avg_Load_Time),
  y = target,
  trControl = train_control,
  method = "glm", # logistic regression
  family = "binomial",
  metric = "ROC"
)
库(插入符号)
##调谐与参数
种子集(123)

训练控制当你洗牌数据并且每个类都有足够的例子时,它会更容易

如果没有足够的示例,可以使用SMOTE(合成少数过采样技术)增加少数类的大小。包装
smotefamily
在右侧


然后,您将能够在不引发任何问题的情况下进行5到10次交叉验证。

当您洗牌数据并且每个类都有足够的示例时,会更容易

如果没有足够的示例,可以使用SMOTE(合成少数过采样技术)增加少数类的大小。包装
smotefamily
在右侧

然后,您将能够进行5到10倍的交叉验证,而不会引发任何问题