Machine learning 对训练集中多个副本敏感的决策树

Machine learning 对训练集中多个副本敏感的决策树,machine-learning,decision-tree,Machine Learning,Decision Tree,决策树是否对添加多个副本敏感 训练集中的同一个实例 如果是,原因是什么?这取决于实施情况 对于树的创建,您将使用一些标准分割剩余的学习集。最常用的方法是增加以下叶片的纯度(纯度可以被视为在一片叶片中具有所有相同的类别)。如果将纯度定义为每个示例中a类和B类元素之间的比率,则多个副本最终将位于同一个叶中,并使拆分朝着有利于它们的方向倾斜 我知道有些实现会考虑到这一点,并使用其他标准来克服这个问题 这取决于实施情况 对于树的创建,您将使用一些标准分割剩余的学习集。最常用的方法是增加以下叶片的纯度(纯

决策树是否对添加多个副本敏感 训练集中的同一个实例


如果是,原因是什么?

这取决于实施情况

对于树的创建,您将使用一些标准分割剩余的学习集。最常用的方法是增加以下叶片的纯度(纯度可以被视为在一片叶片中具有所有相同的类别)。如果将纯度定义为每个示例中a类和B类元素之间的比率,则多个副本最终将位于同一个叶中,并使拆分朝着有利于它们的方向倾斜


我知道有些实现会考虑到这一点,并使用其他标准来克服这个问题

这取决于实施情况

对于树的创建,您将使用一些标准分割剩余的学习集。最常用的方法是增加以下叶片的纯度(纯度可以被视为在一片叶片中具有所有相同的类别)。如果将纯度定义为每个示例中a类和B类元素之间的比率,则多个副本最终将位于同一个叶中,并使拆分朝着有利于它们的方向倾斜

我知道有些实现会考虑到这一点,并使用其他标准来克服这个问题