R 机器学习功能通过在多个核之间分配工作来处理大量数据
我尝试在一些大数据(不是大数据)上使用r运行一些机器学习算法 我用来测试代码的玩具数据(相对较小)只有不到100000行和850列(包括具有14个级别的1因子列) 我正在尝试运行一个svm(包:R 机器学习功能通过在多个核之间分配工作来处理大量数据,r,optimization,tree,machine-learning,svm,R,Optimization,Tree,Machine Learning,Svm,我尝试在一些大数据(不是大数据)上使用r运行一些机器学习算法 我用来测试代码的玩具数据(相对较小)只有不到100000行和850列(包括具有14个级别的1因子列) 我正在尝试运行一个svm(包:e1071)、一个树(包:tree)、一个随机林(包:randomfree)和一个增强树(包:gbm) 我正在使用的计算机有12个核。当我打开活动监视器时,函数似乎随机使用核心(一次最多4个)是否有一个功能可以更有效地将工作分配到所有内核?在允许您使用多核选项的同时,插入符号包可以完成所有这些功能 lib
e1071
)、一个树(包:tree
)、一个随机林(包:randomfree
)和一个增强树(包:gbm
)
我正在使用的计算机有12个核。当我打开活动监视器时,函数似乎随机使用核心(一次最多4个)是否有一个功能可以更有效地将工作分配到所有内核?在允许您使用多核选项的同时,
插入符号
包可以完成所有这些功能
library(doMC)
registerDoMC(cores = 5)
#All subsequent models are then run in parallel
model <- train(y ~ ., data = training, method = "rf")
库(doMC)
registerDoMC(核心=5)
#然后,所有后续模型并行运行
模型