Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/ssis/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/ionic-framework/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
mlr3中的CV或训练/预测_Mlr3 - Fatal编程技术网

mlr3中的CV或训练/预测

mlr3中的CV或训练/预测,mlr3,Mlr3,在Patrick Schratz的“交叉验证-训练/预测”一文中 提到: (a) CV用于获得模型性能的估计值 (b) 训练/预测是为了创建最终预测(你的老板可能会用它来做一些决策) 这意味着在mlr3中,如果我们在学术界,需要发表论文,我们需要使用CV来比较不同算法的性能。在工业领域,如果我们的计划是训练一个模型,然后必须反复使用工业数据进行预测,我们需要使用mlr3提供的训练/预测方法 是不是我选错了什么 谢谢你如果你想对模特的表现发表意见,你总是需要一份简历 如果要使用该模型对未知数据进

在Patrick Schratz的“交叉验证-训练/预测”一文中

提到:

(a) CV用于获得模型性能的估计值

(b) 训练/预测是为了创建最终预测(你的老板可能会用它来做一些决策)

这意味着在mlr3中,如果我们在学术界,需要发表论文,我们需要使用CV来比较不同算法的性能。在工业领域,如果我们的计划是训练一个模型,然后必须反复使用工业数据进行预测,我们需要使用mlr3提供的训练/预测方法

是不是我选错了什么


谢谢你

如果你想对模特的表现发表意见,你总是需要一份简历

如果要使用该模型对未知数据进行预测,请进行一次拟合,然后进行预测

所以在实践中,你需要两者:CV+“训练+预测”

附言:你的帖子并不适合Stackoverflow,因为它与编码问题无关。有关统计问题,请参见


PS2:如果你谈论一篇文章,请包括链接。我是这篇文章的作者,但大多数人可能不知道你在说什么;)

感谢pat-s,我编辑了我的帖子并加入了链接。但在学术界(我们必须将一个算法的性能与其他算法进行比较),CV的使用被广泛使用,因为我们使用了多个公开可用的数据集和多个分类器。这实际上取决于你想在“学术界”取得什么成就。如果您的目标是在一些数据集中比较算法,那么只使用CV(嵌套CV以避免偏差)就足够了。但是,如果您想建立一个now模型,用它来进行实际预测,以便做出一些决定,那么在执行所有CV后,看看哪个模型是好的(最好的),您将在所有标记的数据上拟合该模型,并用它来预测未标记的数据。@missue,好的,我明白您的意思了。。这意味着,如果我们必须比较这些算法,并指出向社区提供信息的最佳算法(就像人们通常在学术界发表的出版物那样),我们应该使用CVs。如果我们必须使用一个模型来预测某些值(可能是行业数据),首先我们必须使用CV(找到最佳模型),然后选择该模型来预测我们的数据?如果我可以在这里给出一个建议,如果它是可行的话:应该有一个专门用于mlr的公共论坛/邮件论坛等,这不是一个好主意吗。?mlr3是新的,我们很多人都是新手,所以一个公共论坛将是一个好主意。。关于mlr3的更新也可以在那里讨论。