如何使用Rminer和nnet_R_Neural Network_Data Mining_Nnet

如何使用Rminer和nnet

r neural-network

如何使用Rminer和nnet,r,neural-network,data-mining,nnet,R,Neural Network,Data Mining,Nnet,我是R的新程序员，正在写一篇训练神经网络的论文。首先，我使用rminer进行数据挖掘，然后使用nnet进行培训。现在，我不知道在训练集和验证集中使用哪个函数来划分数据集，因此使用k-fold交叉验证，并在使用nnet之后对每一个进行验证。对不起我的英语。提前感谢当您不知道如何进行时，这里有一种在R中获取新主题/程序包帮助的方法： library(help=package.name) 这将为您提供用该语言定义的所有函数和数据集的概述，并为每个函数和数据集提供一个简短的标题。确定所需功能后

我是R的新程序员，正在写一篇训练神经网络的论文。首先，我使用rminer进行数据挖掘，然后使用nnet进行培训。现在，我不知道在训练集和验证集中使用哪个函数来划分数据集，因此使用k-fold交叉验证，并在使用nnet之后对每一个进行验证。对不起我的英语。

提前感谢

当您不知道如何进行时，这里有一种在R中获取新主题/程序包帮助的方法：

library(help=package.name)

这将为您提供用该语言定义的所有函数和数据集的概述，并为每个函数和数据集提供一个简短的标题。确定所需功能后，您可以查阅相关功能的文档，如：

?function.name

在文档中，还要注意

另请参见

部分，该部分通常列出了与所考虑的功能结合使用的功能。此外，请使用示例。你也可以使用

example(function.name)

用于演示函数的用法和使用该函数的常用习惯用法

最后，如果您幸运的话，包作者可能已经为包编写了一个

小插曲

。您可以在这样的包中搜索所有渐晕图：

vignette(package="package.name")

希望这能让您开始使用

rminer

和

nnet

软件包。

可能太晚了，但我在寻找问题答案时发现了这个问题。你可以用这样的东西

    # Splitting in training, Cross-Validation and test datasets
        #The entire dataset has 100% of the observations. The training dataset will have 60%, the Cross-Validation (CV) will have 20% and the testing dataset will have 20%.                                                                                                                                
        train_ind <- sample(seq_len(nrow(DF.mergedPredModels)), size = floor(0.6 * nrow(DF.mergedPredModels)))
        trainDF.mergedPredModels <- DF.mergedPredModels[train_ind, ]

        # The CV and testing datasets' observations will be built from the observations from the initial dataset excepting the ones from the training dataset
        # Cross-Validation dataset
        # The CV's number of observations can be changed simply by changing "0.5" to a fraction of your choice but the CV and testing dataset's fractions must add up to 1.
        cvDF.mergedPredModels <- DF.mergedPredModels[-train_ind, ][sample(seq_len(nrow(DF.mergedPredModels[-train_ind, ])), size = floor(0.5 * nrow(DF.mergedPredModels[-train_ind, ]))),]

        # Testing dataset
        testDF.mergedPredModels <- DF.mergedPredModels[-train_ind, ][-sample(seq_len(nrow(DF.mergedPredModels[-train_ind, ])), size = floor(0.5 * nrow(DF.mergedPredModels[-train_ind, ]))),]

        #temporal data and other will be added after the predictions are made because I don't need the models to be built on the dates. Additionally, you can add these columns to the training, CV and testing datasets and plot the real values of your predicted parameter and the respective predicitons over your time variables (half-hour, hour, day, week, month, quarter, season, year, etc.).
        # aa = Explicitly specify the columns to be used in the temporal datasets
        aa <- c("date", "period", "publish_date", "quarter", "month", "Season")
        temporaltrainDF.mergedPredModels <- trainDF.mergedPredModels[, c(aa)]
        temporalcvDF.mergedPredModels <- cvDF.mergedPredModels[, c(aa)]
        temporaltestDF.mergedPredModels <- testDF.mergedPredModels[, c(aa)]

        # bb = Explicitly specify the columns to be used in the training, CV and testing datasets
        bb <- c("quarter", "month", "Season", "period", "temp.mean", "wind_speed.mean", "solar_radiation", "realValue")
        trainDF.mergedPredModels.Orig <- trainDF.mergedPredModels[, c(bb)]
        trainDF.mergedPredModels <- trainDF.mergedPredModels[, c(bb)]
        smalltrainDF.mergedPredModels.Orig <- trainDF.mergedPredModels.Orig[1:10,] #see if the models converge without errors
        cvDF.mergedPredModels <- cvDF.mergedPredModels[, c(bb)]
        testDF.mergedPredModels <- testDF.mergedPredModels[, c(bb)]
# /Splitting in training, Cross-Validation and test datasets

#在培训、交叉验证和测试数据集中进行拆分
#整个数据集具有100%的观测值。培训数据集将有60%，交叉验证（CV）将有20%，测试数据集将有20%。
火车头