Statistics 解释决策树中的数字_Statistics_Julia_Decision Tree

Statistics 解释决策树中的数字

statistics julia

Statistics 解释决策树中的数字,statistics,julia,decision-tree,Statistics,Julia,Decision Tree,使用著名的虹膜数据集和Julia决策树分类器，我得到以下树 using RDatasets using DecisionTree iris = dataset("datasets", "iris") features = convert(Array, iris[:, 1:4]) labels = convert(Array, iris[:, 5]); model = build_tree(labels, features) model = prune_tree(model, 0.9) prin

使用著名的虹膜数据集和Julia决策树分类器，我得到以下树

using RDatasets
using DecisionTree
iris = dataset("datasets", "iris")
features = convert(Array, iris[:, 1:4])
labels = convert(Array, iris[:, 5]);
model = build_tree(labels, features)
model = prune_tree(model, 0.9)

print_tree(model)
Feature 3, Threshold 3.0
L-> setosa : 50/50
R-> Feature 4, Threshold 1.8
    L-> Feature 3, Threshold 5.0
        L-> versicolor : 47/48
        R-> Feature 4, Threshold 1.6
            L-> virginica : 3/3
            R-> Feature 1, Threshold 7.2
                L-> versicolor : 2/2
                R-> virginica : 1/1
    R-> Feature 3, Threshold 4.9
        L-> Feature 1, Threshold 6.0
            L-> versicolor : 1/1
            R-> virginica : 2/2
        R-> virginica : 43/43

我真的无法解释一些分支后面的数字，比如“setosa:50/50”或“virginica:3/3”

有人能解释一下这些是什么意思吗？

看起来在节点“setosa:50/50”上，50朵花被正确分类（50朵花被转换成这个节点，50朵花是setosa）花色：47/48意味着其中一个是维吉尼亚或刚毛