如何使用mlr3输入数据,并使用NA值进行预测?

如何使用mlr3输入数据,并使用NA值进行预测?,r,imputation,mlr3,R,Imputation,Mlr3,我遵循mlr3关于管道数据插补的规定。但是,如果一列为NA,我训练的模式不允许预测 你知道为什么它不起作用吗 火车站 预测步 错误是 Error: Missing data in columns: cyl. 中的示例似乎适用于您的案例,因此您基本上 必须切换imputehist和missind的顺序 另一种方法是将missind的which超参数设置为all,以便强制为每个列创建一个指示符 这实际上是一个bug,如果missind接受了数据方面的培训,它会返回完整的任务 无遗漏,从而覆盖插补值

我遵循mlr3关于管道数据插补的规定。但是,如果一列为NA,我训练的模式不允许预测

你知道为什么它不起作用吗

火车站

预测步

错误是

Error: Missing data in columns: cyl.
中的示例似乎适用于您的案例,因此您基本上 必须切换imputehist和missind的顺序

另一种方法是将missind的which超参数设置为all,以便强制为每个列创建一个指示符

这实际上是一个bug,如果missind接受了数据方面的培训,它会返回完整的任务 无遗漏,从而覆盖插补值。 非常感谢你发现了它。我试图在这里解决它

中的示例似乎适用于您的案例,因此您基本上 必须切换imputehist和missind的顺序

另一种方法是将missind的which超参数设置为all,以便强制为每个列创建一个指示符

这实际上是一个bug,如果missind接受了数据方面的培训,它会返回完整的任务 无遗漏,从而覆盖插补值。
非常感谢你发现了它。我正在尝试在此处修复它

好的,我将尝试您的解决方案。然而,我有一个关于只处理少数变量的可能性的问题。假设我有一个包含2个分类变量和3个数值变量的数据集。我想分别对分类变量和数值变量进行预处理,全部以并行方式进行。有没有可能有一个“po”允许我为特定的处理选择几个变量?是的,请查看PipepComputer中的Impact_columns超参数,并使用适当的选择器。许多PipeOps都支持此超参数。例如,以下示例仅选择一个列:POIMPUTERHIST,param_vals=listaffect_columns=selector_nameSepal.Length通过po“encode”赋予原始因子列后,如何删除它们?poselect允许选择/取消选择列。但是po'encode'应该自动删除原始因子列。好的,我试试你的解决方案。然而,我有一个关于只处理少数变量的可能性的问题。假设我有一个包含2个分类变量和3个数值变量的数据集。我想分别对分类变量和数值变量进行预处理,全部以并行方式进行。有没有可能有一个“po”允许我为特定的处理选择几个变量?是的,请查看PipepComputer中的Impact_columns超参数,并使用适当的选择器。许多PipeOps都支持此超参数。例如,以下示例仅选择一个列:POIMPUTERHIST,param_vals=listaffect_columns=selector_nameSepal.Length通过po“encode”赋予原始因子列后,如何删除它们?poselect允许选择/取消选择列。但是po'encode'应该自动删除原始因子列。
data = task_mtcars$data()[12:12,]
data[1:1, cyl:=NA]
predict(graphlearner, data)
Error: Missing data in columns: cyl.