Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/firebase/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
createDataPartition不分区数据_R_Partitioning_Training Data_Test Data - Fatal编程技术网

createDataPartition不分区数据

createDataPartition不分区数据,r,partitioning,training-data,test-data,R,Partitioning,Training Data,Test Data,我试图使用R中的createDataPartition将数据帧分割为训练集和测试集,训练集拥有60%的数据。当我运行这段代码并查看生成的对象时,SF.training_2拥有所有的观察结果,而SF_test.2没有。帮忙?我还收到一条错误消息,即summary命令无法识别,尽管我在代码的其他地方成功地运行了它,但我发现这令人困惑/担心 inTrain <- createDataPartition( y = paste(data_train_test$Rooms,

我试图使用R中的createDataPartition将数据帧分割为训练集和测试集,训练集拥有60%的数据。当我运行这段代码并查看生成的对象时,SF.training_2拥有所有的观察结果,而SF_test.2没有。帮忙?我还收到一条错误消息,即summary命令无法识别,尽管我在代码的其他地方成功地运行了它,但我发现这令人困惑/担心

inTrain <- createDataPartition(
  y = paste(data_train_test$Rooms, 
            data_train_test$crime_nn5, 
            data_train_test$nhood, 
            data_train_test$BLDGSQFT, 
            data_train_test$estimate),
  p = .60, 
  list = FALSE)

SF.training_2 <- data_train_test[inTrain,]

summmary(SF.training_2)

SF.test_2 <- data_train_test[-inTrain,]

inTrain您似乎使用了插入符号和Tidyverse库。为了帮助您,我们需要一些数据示例。让我们创建一个虚构的数据集:

library(caret)
library(tidyverse)
data_train_test <- data.frame(Rooms c("a","b","c","a","b","c","a","b","c","a"),
                          crime_nn5 = c(2,3,4,2,3,2,3,2,3,4), nhood = c("Alvem","Rhye","Huttons","Rhye","Olan","Alvem","Olan","Huttons","Alvem","Rhye"),
                          BLDGSQFT = c(400,600,660,480,590,480,510,500,700,570),
                          estimate = c(34000, 55000, 60000, 37000, 50000, 45000, 48000, 51000, 80000, 52000))
库(插入符号)
图书馆(tidyverse)

数据训练测试您似乎使用了插入符号和Tidyverse库。为了帮助您,我们需要一些数据示例。让我们创建一个虚构的数据集:

library(caret)
library(tidyverse)
data_train_test <- data.frame(Rooms c("a","b","c","a","b","c","a","b","c","a"),
                          crime_nn5 = c(2,3,4,2,3,2,3,2,3,4), nhood = c("Alvem","Rhye","Huttons","Rhye","Olan","Alvem","Olan","Huttons","Alvem","Rhye"),
                          BLDGSQFT = c(400,600,660,480,590,480,510,500,700,570),
                          estimate = c(34000, 55000, 60000, 37000, 50000, 45000, 48000, 51000, 80000, 52000))
库(插入符号)
图书馆(tidyverse)

你需要提供更多的信息。如果您使用的函数不在base R中,则必须包含显示您使用的软件包的代码。函数
createDataPartition
不在base R中。请使用
dput()
为我们提供一些数据,以便我们可以运行您的代码。我的第一个猜测是,您指定的向量包含太多的组(
y=paste(…)
)。
table(y=paste(..)
给了您什么?您需要提供更多信息。如果您使用的函数不在base R中,则必须包含显示您使用的软件包的代码。函数
createDataPartition
不在base R中。请使用
dput()
为我们提供一些数据,以便我们可以运行您的代码。我的第一个猜测是,您指定的向量包含太多的组(
y=paste(…)
)。
table(y=paste(..)
给了您什么?