Algorithm C4.5算法如何处理属性相同但结果不同的数据?
我正在尝试为一个学校项目创建一个带有C4.5算法的决策树。决策树用于,属性信息如下Algorithm C4.5算法如何处理属性相同但结果不同的数据?,algorithm,decision-tree,j48,c4.5,Algorithm,Decision Tree,J48,C4.5,我正在尝试为一个学校项目创建一个带有C4.5算法的决策树。决策树用于,属性信息如下 Attribute Information: 1. Age of patient at time of operation (numerical) 2. Patient's year of operation (year - 1900, numerical) 3. Number of positive axillary nodes detected (numerical) 4. Survival status
Attribute Information:
1. Age of patient at time of operation (numerical)
2. Patient's year of operation (year - 1900, numerical)
3. Number of positive axillary nodes detected (numerical)
4. Survival status (class attribute)
1 = the patient survived 5 years or longer
2 = the patient died within 5 year
我们需要实现一个决策树,其中每个叶必须有一个不同的结果(这意味着该叶的熵应该为0),但是有六个实例具有相同的属性,但结果不同
例如:
66,58,0,2
66,58,0,1
C4.5算法在这种情况下做了什么,我到处搜索,但找不到任何信息
谢谢。阅读昆兰,J.R.C4.5:机器学习程序。摩根·考夫曼出版社,1993年。(如果你有大学作业,学习C4.5是一件好事)
从我所学的。看起来像是在第137页,源代码清单build.c
有一行
//*如果所有案例都相同。。。。或者没有足够的案例来划分
(如您的问题)它将
返回节点
此节点来自
Node=Leaf(ClassFreq、BestClass、Cases、Cases NoBestClass)代码>
ClassFreq store每个类的计数
BestClass store,它是
主类(大多数频率)案例存储有多少数据
NoBestClass存储BestClass的多少数据
此叶函数来自文件Trees.c
此叶函数将返回一个叶为bestClass(bestClass成为叶)的节点
所有这些信息都参考
昆兰,J.R.C4.5:机器学习程序。摩根·考夫曼出版社,1993年。
任何知道这一点的人,如果我做错了什么,请发表评论。感谢阅读昆兰,J.R.C4.5:机器学习程序。摩根·考夫曼出版社,1993年。(如果你有大学作业,学习C4.5是一件好事)
从我所学的。看起来像是在第137页,源代码清单build.c
有一行
//*如果所有案例都相同。。。。或者没有足够的案例来划分
(如您的问题)
它将返回节点
此节点来自
Node=Leaf(ClassFreq、BestClass、Cases、Cases NoBestClass)代码>
ClassFreq store每个类的计数
BestClass store,它是
主类(大多数频率)案例存储有多少数据
NoBestClass存储BestClass的多少数据
此叶函数来自文件Trees.c
此叶函数将返回一个叶为bestClass(bestClass成为叶)的节点
所有这些信息都参考
昆兰,J.R.C4.5:机器学习程序。摩根·考夫曼出版社,1993年。
任何知道这一点的人,如果我做错了什么,请发表评论。谢谢Yazlab başa bela dimi:)@EmreKantar haha,aynen.)Yazlab başa bela dimi:)@EmreKantar haha,aynen.)