如何使用mlr3输入数据，并使用NA值进行预测？_R_Imputation_Mlr3

如何使用mlr3输入数据，并使用NA值进行预测？

如何使用mlr3输入数据，并使用NA值进行预测？,r,imputation,mlr3,R,Imputation,Mlr3,我遵循mlr3关于管道数据插补的规定。但是，如果一列为NA，我训练的模式不允许预测你知道为什么它不起作用吗火车站预测步错误是 Error: Missing data in columns: cyl. 中的示例似乎适用于您的案例，因此您基本上必须切换imputehist和missind的顺序另一种方法是将missind的which超参数设置为all，以便强制为每个列创建一个指示符这实际上是一个bug，如果missind接受了数据方面的培训，它会返回完整的任务无遗漏，从而覆盖插补值

我遵循mlr3关于管道数据插补的规定。但是，如果一列为NA，我训练的模式不允许预测

你知道为什么它不起作用吗

火车站

预测步

错误是

Error: Missing data in columns: cyl.

中的示例似乎适用于您的案例，因此您基本上必须切换imputehist和missind的顺序

另一种方法是将missind的which超参数设置为all，以便强制为每个列创建一个指示符

这实际上是一个bug，如果missind接受了数据方面的培训，它会返回完整的任务无遗漏，从而覆盖插补值。非常感谢你发现了它。我试图在这里解决它

中的示例似乎适用于您的案例，因此您基本上必须切换imputehist和missind的顺序

另一种方法是将missind的which超参数设置为all，以便强制为每个列创建一个指示符

这实际上是一个bug，如果missind接受了数据方面的培训，它会返回完整的任务无遗漏，从而覆盖插补值。

非常感谢你发现了它。我正在尝试在此处修复它

好的，我将尝试您的解决方案。然而，我有一个关于只处理少数变量的可能性的问题。假设我有一个包含2个分类变量和3个数值变量的数据集。我想分别对分类变量和数值变量进行预处理，全部以并行方式进行。有没有可能有一个“po”允许我为特定的处理选择几个变量？是的，请查看PipepComputer中的Impact_columns超参数，并使用适当的选择器。许多PipeOps都支持此超参数。例如，以下示例仅选择一个列：POIMPUTERHIST，param_vals=listaffect_columns=selector_nameSepal.Length通过po“encode”赋予原始因子列后，如何删除它们？poselect允许选择/取消选择列。但是po'encode'应该自动删除原始因子列。好的，我试试你的解决方案。然而，我有一个关于只处理少数变量的可能性的问题。假设我有一个包含2个分类变量和3个数值变量的数据集。我想分别对分类变量和数值变量进行预处理，全部以并行方式进行。有没有可能有一个“po”允许我为特定的处理选择几个变量？是的，请查看PipepComputer中的Impact_columns超参数，并使用适当的选择器。许多PipeOps都支持此超参数。例如，以下示例仅选择一个列：POIMPUTERHIST，param_vals=listaffect_columns=selector_nameSepal.Length通过po“encode”赋予原始因子列后，如何删除它们？poselect允许选择/取消选择列。但是po'encode'应该自动删除原始因子列。

data = task_mtcars$data()[12:12,]
data[1:1, cyl:=NA]
predict(graphlearner, data)

Error: Missing data in columns: cyl.