Tree Weka决策树预测与缺失值的NA处理_Tree_Weka_Decision Tree_Missing Data

Tree Weka决策树预测与缺失值的NA处理

tree

Tree Weka决策树预测与缺失值的NA处理,tree,weka,decision-tree,missing-data,Tree,Weka,Decision Tree,Missing Data,您好，目前我正在实施一个大型Hellinger距离决策树，我遇到了一个问题。我在树节点中有一个连续变量，我不知道树如何预测我是否会丢失该变量的值。例如，该节点的拆分条件为250。预测时，树将选择什么路径？树训练数据在该变量中也缺少值也许我应该用一个特定的数字来替换所有缺失的值？您可以根据变量的行为采取相应的操作。还要考虑分类器的值的影响。因此，如果可以将其广义化，您可以使用最小值/最大值/平均值来表示缺少的值。通常坚持输入不包含空值，然后用户可以找到一种方法在拟合之前对其进行编码。如果你做

您好，目前我正在实施一个大型Hellinger距离决策树，我遇到了一个问题。我在树节点中有一个连续变量，我不知道树如何预测我是否会丢失该变量的值。例如，该节点的拆分条件为250。预测时，树将选择什么路径？树训练数据在该变量中也缺少值

也许我应该用一个特定的数字来替换所有缺失的值？

您可以根据变量的行为采取相应的操作。还要考虑分类器的值的影响。因此，如果可以将其广义化，您可以使用最小值/最大值/平均值来表示缺少的值。

通常坚持输入不包含空值，然后用户可以找到一种方法在拟合之前对其进行编码。如果你做出选择，那么你就是在强迫未来的用户使用你的选择