Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/82.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
希望在R编程中创建用户定义的函数,用于将数据拆分为训练和测试,并从函数中返回样本、训练和测试_R_Machine Learning_Regression - Fatal编程技术网

希望在R编程中创建用户定义的函数,用于将数据拆分为训练和测试,并从函数中返回样本、训练和测试

希望在R编程中创建用户定义的函数,用于将数据拆分为训练和测试,并从函数中返回样本、训练和测试,r,machine-learning,regression,R,Machine Learning,Regression,我应该如何将这些数据放入用户定义的函数中,这样我就不必重复它,当我传递我读取的文件时,它将分割数据并返回样本、训练和测试数据?您可以使用这些函数创建测试和训练集 totalrows=nrow(x) s=sample(seq(1,totalrows),0.7*totalrows) train=x[s,] test=x[-s,] 您可以编辑拆分比率,并将其设置为数据集所需的比率。@Mitesh Shah如果这回答了您的问题,请投赞成票。 #Creating train set create_tra

我应该如何将这些数据放入用户定义的函数中,这样我就不必重复它,当我传递我读取的文件时,它将分割数据并返回样本、训练和测试数据?

您可以使用这些函数创建测试和训练集

totalrows=nrow(x)
s=sample(seq(1,totalrows),0.7*totalrows)
train=x[s,]
test=x[-s,]

您可以编辑拆分比率,并将其设置为数据集所需的比率。

@Mitesh Shah如果这回答了您的问题,请投赞成票。
#Creating train set
create_train_split <- function(dataset){
library(caTools)
set.seed(123) 
split = sample.split(dataset, SplitRatio = 2/3)
training_set = subset(dataset, split == TRUE)
return(training_set)
}

#The same way creating test set
create_test_split <- function(dataset){
library(caTools)
set.seed(123) 
split = sample.split(dataset, SplitRatio = 2/3)
test_set = subset(dataset, split == FALSE)
return(test_set)
}
train_set = create_train_split(dataset)
test_set = create_test_split(dataset)