createDataPartition不分区数据
我试图使用R中的createDataPartition将数据帧分割为训练集和测试集,训练集拥有60%的数据。当我运行这段代码并查看生成的对象时,SF.training_2拥有所有的观察结果,而SF_test.2没有。帮忙?我还收到一条错误消息,即summary命令无法识别,尽管我在代码的其他地方成功地运行了它,但我发现这令人困惑/担心createDataPartition不分区数据,r,partitioning,training-data,test-data,R,Partitioning,Training Data,Test Data,我试图使用R中的createDataPartition将数据帧分割为训练集和测试集,训练集拥有60%的数据。当我运行这段代码并查看生成的对象时,SF.training_2拥有所有的观察结果,而SF_test.2没有。帮忙?我还收到一条错误消息,即summary命令无法识别,尽管我在代码的其他地方成功地运行了它,但我发现这令人困惑/担心 inTrain <- createDataPartition( y = paste(data_train_test$Rooms,
inTrain <- createDataPartition(
y = paste(data_train_test$Rooms,
data_train_test$crime_nn5,
data_train_test$nhood,
data_train_test$BLDGSQFT,
data_train_test$estimate),
p = .60,
list = FALSE)
SF.training_2 <- data_train_test[inTrain,]
summmary(SF.training_2)
SF.test_2 <- data_train_test[-inTrain,]
inTrain您似乎使用了插入符号和Tidyverse库。为了帮助您,我们需要一些数据示例。让我们创建一个虚构的数据集:
library(caret)
library(tidyverse)
data_train_test <- data.frame(Rooms c("a","b","c","a","b","c","a","b","c","a"),
crime_nn5 = c(2,3,4,2,3,2,3,2,3,4), nhood = c("Alvem","Rhye","Huttons","Rhye","Olan","Alvem","Olan","Huttons","Alvem","Rhye"),
BLDGSQFT = c(400,600,660,480,590,480,510,500,700,570),
estimate = c(34000, 55000, 60000, 37000, 50000, 45000, 48000, 51000, 80000, 52000))
库(插入符号)
图书馆(tidyverse)
数据训练测试您似乎使用了插入符号和Tidyverse库。为了帮助您,我们需要一些数据示例。让我们创建一个虚构的数据集:
library(caret)
library(tidyverse)
data_train_test <- data.frame(Rooms c("a","b","c","a","b","c","a","b","c","a"),
crime_nn5 = c(2,3,4,2,3,2,3,2,3,4), nhood = c("Alvem","Rhye","Huttons","Rhye","Olan","Alvem","Olan","Huttons","Alvem","Rhye"),
BLDGSQFT = c(400,600,660,480,590,480,510,500,700,570),
estimate = c(34000, 55000, 60000, 37000, 50000, 45000, 48000, 51000, 80000, 52000))
库(插入符号)
图书馆(tidyverse)
你需要提供更多的信息。如果您使用的函数不在base R中,则必须包含显示您使用的软件包的代码。函数createDataPartition
不在base R中。请使用dput()
为我们提供一些数据,以便我们可以运行您的代码。我的第一个猜测是,您指定的向量包含太多的组(y=paste(…)
)。table(y=paste(..)
给了您什么?您需要提供更多信息。如果您使用的函数不在base R中,则必须包含显示您使用的软件包的代码。函数createDataPartition
不在base R中。请使用dput()
为我们提供一些数据,以便我们可以运行您的代码。我的第一个猜测是,您指定的向量包含太多的组(y=paste(…)
)。table(y=paste(..)
给了您什么?