R中随机森林的再现性问题

R中随机森林的再现性问题,r,random-forest,R,Random Forest,我正在使用一个代谢组学数据集,该数据集由12个样本(6个野生型和6个敲除型)和375个代谢物组成。 我尝试使用随机森林作为分类算法来确定最重要的代谢物,以区分一组和另一组。为此,我考虑的是平均降低精度。 我的问题是,每次运行代码时,即使设置了种子,也会得到完全不同的结果。我怀疑我的问题与大量功能相比,小样本集有关。但另一方面,我看到一些出版物正是这样做的(具有相似数量的特征和样本),甚至没有提及再现性问题 这是我的密码 library(ggplot2) library(cowplot) libr

我正在使用一个代谢组学数据集,该数据集由12个样本(6个野生型和6个敲除型)和375个代谢物组成。 我尝试使用随机森林作为分类算法来确定最重要的代谢物,以区分一组和另一组。为此,我考虑的是平均降低精度。 我的问题是,每次运行代码时,即使设置了种子,也会得到完全不同的结果。我怀疑我的问题与大量功能相比,小样本集有关。但另一方面,我看到一些出版物正是这样做的(具有相似数量的特征和样本),甚至没有提及再现性问题

这是我的密码

library(ggplot2)
library(cowplot)
library(randomForest)

set.seed(123456)

data <-read.table("Group1_RF.csv",header=TRUE,sep=",",row.names = 1)

head(data)
data$class <- as.factor(data$class) 


model2 <- randomForest(class ~ ., data=data,ntree=1000, mtry=19, proximity=TRUE,importance=TRUE)
varImpPlot(model2)
库(ggplot2)
图书馆(cowplot)
图书馆(森林)
种子集(123456)
数据