Algorithm C4.5算法如何处理属性相同但结果不同的数据?

Algorithm C4.5算法如何处理属性相同但结果不同的数据?,algorithm,decision-tree,j48,c4.5,Algorithm,Decision Tree,J48,C4.5,我正在尝试为一个学校项目创建一个带有C4.5算法的决策树。决策树用于,属性信息如下 Attribute Information: 1. Age of patient at time of operation (numerical) 2. Patient's year of operation (year - 1900, numerical) 3. Number of positive axillary nodes detected (numerical) 4. Survival status

我正在尝试为一个学校项目创建一个带有C4.5算法的决策树。决策树用于,属性信息如下

Attribute Information:

1. Age of patient at time of operation (numerical)
2. Patient's year of operation (year - 1900, numerical)
3. Number of positive axillary nodes detected (numerical)
4. Survival status (class attribute)
    1 = the patient survived 5 years or longer
    2 = the patient died within 5 year
我们需要实现一个决策树,其中每个叶必须有一个不同的结果(这意味着该叶的熵应该为0),但是有六个实例具有相同的属性,但结果不同

例如:

66,58,0,2
66,58,0,1
C4.5算法在这种情况下做了什么,我到处搜索,但找不到任何信息


谢谢。

阅读昆兰,J.R.C4.5:机器学习程序。摩根·考夫曼出版社,1993年。(如果你有大学作业,学习C4.5是一件好事)

从我所学的。看起来像是在第137页,源代码清单build.c
有一行
//*如果所有案例都相同。。。。或者没有足够的案例来划分
(如您的问题)
它将
返回节点

此节点来自
Node=Leaf(ClassFreq、BestClass、Cases、Cases NoBestClass)

ClassFreq store每个类的计数
BestClass store,它是 主类(大多数频率)案例存储有多少数据
NoBestClass存储BestClass的多少数据

此叶函数来自文件
Trees.c
此叶函数将返回一个叶为
bestClass(bestClass成为叶)的节点

所有这些信息都参考 昆兰,J.R.C4.5:机器学习程序。摩根·考夫曼出版社,1993年。


任何知道这一点的人,如果我做错了什么,请发表评论。感谢阅读昆兰,J.R.C4.5:机器学习程序。摩根·考夫曼出版社,1993年。(如果你有大学作业,学习C4.5是一件好事)

从我所学的。看起来像是在第137页,源代码清单build.c
有一行
//*如果所有案例都相同。。。。或者没有足够的案例来划分
(如您的问题)
它将
返回节点

此节点来自
Node=Leaf(ClassFreq、BestClass、Cases、Cases NoBestClass)

ClassFreq store每个类的计数
BestClass store,它是 主类(大多数频率)案例存储有多少数据
NoBestClass存储BestClass的多少数据

此叶函数来自文件
Trees.c
此叶函数将返回一个叶为
bestClass(bestClass成为叶)的节点

所有这些信息都参考 昆兰,J.R.C4.5:机器学习程序。摩根·考夫曼出版社,1993年。


任何知道这一点的人,如果我做错了什么,请发表评论。谢谢

Yazlab başa bela dimi:)@EmreKantar haha,aynen.)Yazlab başa bela dimi:)@EmreKantar haha,aynen.)