R方-随机森林计算是如何工作的?

R方-随机森林计算是如何工作的?,r,classification,random-forest,party,R,Classification,Random Forest,Party,我正在运行我的第一个随机林算法,使用的是party包中的cforest()。每次我运行cforest算法时,RStudio在发送错误消息“error:cannotallocate vector of size 927kb”后崩溃,这是一个非常小的向量 我尝试使用控件,将参数设置得非常低,以了解其底部,但即使使用controls=cforest_unbiased(ntree=2,mtry=3)它仍然会崩溃,并显示相同的消息 下面是完整的代码行: forest.result.balance$mode

我正在运行我的第一个随机林算法,使用的是
party包中的
cforest()
。每次我运行cforest算法时,RStudio在发送错误消息
“error:cannotallocate vector of size 927kb”
后崩溃,这是一个非常小的向量

我尝试使用控件,将参数设置得非常低,以了解其底部,但即使使用
controls=cforest_unbiased(ntree=2,mtry=3)
它仍然会崩溃,并显示相同的消息

下面是完整的代码行:

forest.result.balance$model.1$forest <- cforest(formula = quotation ~ minute + temp + humidity, data=undersamp.train, controls = cforest_unbiased(ntree=2, mtry=3))

如果您使用
str(小于amp.train)
查看变量类型,它们都是整数还是数字?我以前遇到过内存问题,因为我意外地将一个变量编码为一个因子,它有数百或数千个级别。很可能是这样,我会检查变量的类别!分钟变量可能是一个因素。另外,你的代码看起来一切正常,但我们无法提供帮助,除非我们获得你的数据样本或你提供这些问题的答案。我在上面添加了所需的信息。所有独立变量都是
int
num
。其他想法?使用不同的射频怎么样?Party未针对较大的数据集进行优化。谢谢,我会试试的。我计划尝试RandomForest和Bigrf,但似乎有更好的软件包。我想保留party包,以便将预测性能与我用party包制作的树模型进行比较。此外,如果有人知道为什么它在构建林和(让我吃惊的)预测测试数据方面效率不高,那么欢迎:)如果您使用
str(欠amp.train)
查看变量类型,它们都是整数还是数字?我以前遇到过内存问题,因为我意外地将一个变量编码为一个因子,它有数百或数千个级别。很可能是这样,我会检查变量的类别!分钟变量可能是一个因素。另外,你的代码看起来一切正常,但我们无法提供帮助,除非我们获得你的数据样本或你提供这些问题的答案。我在上面添加了所需的信息。所有独立变量都是
int
num
。其他想法?使用不同的射频怎么样?Party未针对较大的数据集进行优化。谢谢,我会试试的。我计划尝试RandomForest和Bigrf,但似乎有更好的软件包。我想保留party包,以便将预测性能与我用party包制作的树模型进行比较。此外,如果有人能回答为什么它在建造森林和(让我吃惊的)测试数据预测方面效率低下,欢迎:)
str(undersamp.train)
#
Classes ‘tbl_df’, ‘tbl’ and 'data.frame':   68226 obs. of  6 variables:
 $ quotation: Factor w/ 2 levels "0","1": 2 2 2 2 2 2 2 2 2 2 ...
     $ minute   : int  519 922 762 670 793 732 611 848 549 1233 ...
 $ weekday  : int  2 4 0 0 5 0 2 4 3 3 ...
     $ temp     : num  10.23 5.84 13.92 -7.48 6 ...
 $ humidity : num  74.8 95.7 81.8 89.1 98 ...
     $ pressure : num  1027 1023 1017 983 1020 ...