Tree Weka J48实现不同的缺失值处理

Tree Weka J48实现不同的缺失值处理,tree,weka,missing-data,induction,Tree,Weka,Missing Data,Induction,在某些任务中,我必须使用J48树归纳算法来使用中缺少值的数据。现在,我将进行一些经验研究,比较J48树归纳中不同的缺失值方法,使用不同的UCI训练数据集和不同的人工截肢率标准,+10%,+40%截肢数据集 我的主要问题是,如何在J48源代码中实现以下方法,或者更好地在我自己的代码中使用Weka J48类实现以下方法。我可以用元分类器或其他方式处理这种方法吗? 作为J48标准处理和随机林的对应物,我要测试的方法: 删除缺少属性的对象完成案例 热板法寻找概念内供体 代理项拆分使用其他属性进行拆分,如

在某些任务中,我必须使用J48树归纳算法来使用中缺少值的数据。现在,我将进行一些经验研究,比较J48树归纳中不同的缺失值方法,使用不同的UCI训练数据集和不同的人工截肢率标准,+10%,+40%截肢数据集

我的主要问题是,如何在J48源代码中实现以下方法,或者更好地在我自己的代码中使用Weka J48类实现以下方法。我可以用元分类器或其他方式处理这种方法吗? 作为J48标准处理和随机林的对应物,我要测试的方法:

删除缺少属性的对象完成案例 热板法寻找概念内供体 代理项拆分使用其他属性进行拆分,如购物车句柄缺少值 使用其他决策树概念进行插补->缺少属性值以查找缺少的属性值 是否要停用集成J48C4.5缺失值处理?如何停用此功能? 我认为J48C4.5将使用特殊值方法来查找测试、概率分布,并在训练数据划分期间将对象分割成若干部分,在分类期间将对象分割成若干部分

现在大家都知道了其他可以轻松扩展J48的缺失值方法了吗


非常感谢

不确定这是否是您正在寻找的答案,但是在将数据传递给J48之前,如何处理缺少的值呢?例如:您可以删除缺少值的实例,或者在学习最终决策树之前对值进行插补并进行填充。对于插补方法,这将是一种可行的方法。但是,如果对测试数据使用代理属性,那么它将更为重要?!