R 如何保存我训练过的随机森林模型,并将其逐一应用于测试数据文件?

R 如何保存我训练过的随机森林模型,并将其逐一应用于测试数据文件?,r,machine-learning,file-processing,R,Machine Learning,File Processing,这是一个很长的机会,更多的是一个代码设计类的要求像我这样的新手,但我认为它对现实世界的应用程序有真正的价值 核心问题是: 我是否可以在R中保存一个经过训练的ML模型,例如随机森林(RF),并在以后调用/使用它,而无需重新加载用于训练它的所有数据 在现实生活中,当我有一个包含成百上千个待测试数据文件的大型文件夹时,我是否可以加载保存在R中某处的模型,让它逐个读取未知文件(因此我不受RAM大小限制),并对读取的每个文件执行回归/分类等分析,并将所有输出一起存储到文件中 比如说, 如果我在一个文件

这是一个很长的机会,更多的是一个代码设计类的要求像我这样的新手,但我认为它对现实世界的应用程序有真正的价值

核心问题是:

  • 我是否可以在R中保存一个经过训练的ML模型,例如随机森林(RF),并在以后调用/使用它,而无需重新加载用于训练它的所有数据

  • 在现实生活中,当我有一个包含成百上千个待测试数据文件的大型文件夹时,我是否可以加载保存在R中某处的模型,让它逐个读取未知文件(因此我不受RAM大小限制),并对读取的每个文件执行回归/分类等分析,并将所有输出一起存储到文件中

  • 比如说,

    如果我在一个文件夹中有100000个csv数据文件,我想使用其中的30%作为训练集,其余作为随机森林(RF)分类的测试

    我可以选择感兴趣的文件,称之为“控制文件”。然后使用fread()随机抽取这些文件中50%的数据,调用插入符号库或随机森林库,训练我的“模型”


    model你读过这个吗。我相信你可以做saveRDS(model…)
    @StupidWolf现在我有了,谢谢你,伙计。这是一个伟大的开端。既然我可以将模型保存到一个文件中,那么有一个特殊的功能,我应该考虑逐个读取文件,并逐个在文件上应用该模型?弗瑞德?
    model <- train(,x,y,data,method="rf")