Tree Weka决策树预测与缺失值的NA处理

Tree Weka决策树预测与缺失值的NA处理,tree,weka,decision-tree,missing-data,Tree,Weka,Decision Tree,Missing Data,您好,目前我正在实施一个大型Hellinger距离决策树,我遇到了一个问题。我在树节点中有一个连续变量,我不知道树如何预测我是否会丢失该变量的值。 例如,该节点的拆分条件为250。预测时,树将选择什么路径? 树训练数据在该变量中也缺少值 也许我应该用一个特定的数字来替换所有缺失的值?您可以根据变量的行为采取相应的操作。还要考虑分类器的值的影响。因此,如果可以将其广义化,您可以使用最小值/最大值/平均值来表示缺少的值。通常坚持输入不包含空值,然后用户可以找到一种方法在拟合之前对其进行编码。如果你做

您好,目前我正在实施一个大型Hellinger距离决策树,我遇到了一个问题。我在树节点中有一个连续变量,我不知道树如何预测我是否会丢失该变量的值。 例如,该节点的拆分条件为250。预测时,树将选择什么路径? 树训练数据在该变量中也缺少值


也许我应该用一个特定的数字来替换所有缺失的值?

您可以根据变量的行为采取相应的操作。还要考虑分类器的值的影响。因此,如果可以将其广义化,您可以使用最小值/最大值/平均值来表示缺少的值。

通常坚持输入不包含空值,然后用户可以找到一种方法在拟合之前对其进行编码。如果你做出选择,那么你就是在强迫未来的用户使用你的选择