R包含训练集和测试集对象的列表
我正在尝试创建10倍于我的数据。我想要的是一个长度为10(折叠次数)的数据结构,数据结构的每个元素都包含一个对象/数据结构,该对象/数据结构具有两个属性/元素;该折叠处的训练集和测试集。这是我的R代码。 例如,我想通过R包含训练集和测试集对象的列表,r,machine-learning,R,Machine Learning,我正在尝试创建10倍于我的数据。我想要的是一个长度为10(折叠次数)的数据结构,数据结构的每个元素都包含一个对象/数据结构,该对象/数据结构具有两个属性/元素;该折叠处的训练集和测试集。这是我的R代码。 例如,我想通过查看(数据对[[8]]$training\u set)访问折叠8处的训练集。但它没有起作用。任何帮助都将不胜感激:) k看来这个软件包modeler可以在这里帮助您。 我要特别指出: 库(modeler) ex[1]2.88216 或者,可以使用以下方法生成这些分区的数据集:
查看(数据对[[8]]$training\u set)
访问折叠8处的训练集。但它没有起作用。任何帮助都将不胜感激:)
k看来这个软件包modeler
可以在这里帮助您。
我要特别指出:
库(modeler)
ex[1]2.88216
或者,可以使用以下方法生成这些分区的数据集:
crossv\u mc(data,n,test=0.2,id=“.id”)
您非常接近,您只需要在列表中包装值
k <- 10 # number of folds
i <- 1:k
folds <- sample(i, nrow(mtcars), replace = TRUE)
data_pairs <- list()
for (j in i) {
test_ind <- which(folds==j,arr.ind=TRUE)
test <- mtcars[test_ind,]
train <- mtcars[-test_ind,]
data_pair <- list(training_set = train, test_set = test)
data_pairs <- append(x = data_pairs, values = list(data_pair))
#data_pairs <- c(data_pairs, list(data_pair))
}
k
library(modelr)
ex <- resample_partition(mtcars, c(test = 0.3, train = 0.7))
mod <- lm(mpg ~ wt, data = ex$train)
rmse(mod, ex$test)
#> [1] 3.229756
rmse(mod, ex$train)
#> [1] 2.88216
k <- 10 # number of folds
i <- 1:k
folds <- sample(i, nrow(mtcars), replace = TRUE)
data_pairs <- list()
for (j in i) {
test_ind <- which(folds==j,arr.ind=TRUE)
test <- mtcars[test_ind,]
train <- mtcars[-test_ind,]
data_pair <- list(training_set = train, test_set = test)
data_pairs <- append(x = data_pairs, values = list(data_pair))
#data_pairs <- c(data_pairs, list(data_pair))
}