Java 韦卡什么是修剪过的和未修剪过的树?
在决策树J48示例中,当我们说树修剪或未修剪时,有什么区别?未修剪的树更大。发生的情况是,基本上是根据实现的算法创建树,如果启用了修剪,则另一个步骤将查看可以删除哪些节点/分支,而不会对性能造成太大影响Java 韦卡什么是修剪过的和未修剪过的树?,java,weka,Java,Weka,在决策树J48示例中,当我们说树修剪或未修剪时,有什么区别?未修剪的树更大。发生的情况是,基本上是根据实现的算法创建树,如果启用了修剪,则另一个步骤将查看可以删除哪些节点/分支,而不会对性能造成太大影响 修剪背后的想法是,除了使树更容易理解之外,还可以降低过度拟合训练数据的风险。也就是说,能够(几乎)完美地对训练数据进行分类,但除此之外什么都没有,因为树没有学习基本概念,而是学习了训练数据固有的和特定的属性。鉴于Weka是一个机器学习套件,听起来他们指的是: 简言之,决策树的修剪似乎是删除了没
修剪背后的想法是,除了使树更容易理解之外,还可以降低过度拟合训练数据的风险。也就是说,能够(几乎)完美地对训练数据进行分类,但除此之外什么都没有,因为树没有学习基本概念,而是学习了训练数据固有的和特定的属性。鉴于Weka是一个机器学习套件,听起来他们指的是: 简言之,决策树的修剪似乎是删除了没有多少好处的可能决策
但是,我没有使用过weka,也不熟悉它。先听其他答案,看看他们说的是否有道理。我想在拉尔斯的答案中添加以下内容。摘自 许多算法试图“删减”或简化其结果。修剪产生更少、更容易解释的结果。更重要的是,修剪可以作为纠正潜在过度拟合的工具 J48采用两种修剪方法 第一种被称为子树替换。这意味着决策树中的节点可以替换为一个叶子——基本上减少了沿着某条路径的测试数量。这一过程从完全成形的树的叶子开始,并朝着树根向后进行 J48中使用的第二种修剪类型称为子树提升。在这种情况下,一个节点可以向树的根方向向上移动,同时替换沿途的其他节点。子树提升通常对决策树模型的影响可以忽略不计。通常没有明确的方法来预测期权的效用,但如果诱导过程需要很长时间,则最好尝试将其关闭。这是因为子树提升在计算上可能有些复杂
第一句可能是错的。未修剪的树更大,对吗?哦,是的,对不起。我会改变的。