R 支持向量机中预测模型和测试集数据的不同元组数
我有一个数据集,有两列,如下所示,其中第1列,timestamp是一个特定的时间值,第10列给出了该时间实例的总功耗。此数据总共有81502个实例 我正在使用e1071软件包对R中的数据进行支持向量回归,以预测未来的电力使用情况。代码如下所示。我首先将数据集分为训练数据和测试数据。然后使用训练数据,使用svm函数对数据进行建模,然后预测测试集的功耗R 支持向量机中预测模型和测试集数据的不同元组数,r,svm,predict,R,Svm,Predict,我有一个数据集,有两列,如下所示,其中第1列,timestamp是一个特定的时间值,第10列给出了该时间实例的总功耗。此数据总共有81502个实例 我正在使用e1071软件包对R中的数据进行支持向量回归,以预测未来的电力使用情况。代码如下所示。我首先将数据集分为训练数据和测试数据。然后使用训练数据,使用svm函数对数据进行建模,然后预测测试集的功耗 library(e1071) attach(data.csv) index <- 1:nrow(data.csv)
library(e1071)
attach(data.csv)
index <- 1:nrow(data.csv)
testindex <- sample(index,trunc(length(index)/3))
testset <- na.omit(data.csv[testindex, ])
trainingset <- na.omit(data.csv[-testindex, ])
model <- svm(Column.10 ~ timestamp, data=trainingset)
prediction <- predict(model, testset[,-2])
tab <- table(pred = prediction, true = testset[,2])
所以我试着找出两个参数的长度,发现
the length(prediction) to be 81502
and the length(testset[,2]) to be 27167
因为我只对测试集进行了预测,所以我不知道如何对81502个值进行预测。预测值和测试集的总值有何不同?如果我只为测试集提供了功率值,那么整个数据集的功率值是如何得到预测的呢
prediction <- predict(model, testset[,-2])
预测
prediction <- predict(model, testset[,-2])
prediction <- predict(model, testset)