Machine learning 如何将树型特征转换为矢量特征

Machine learning 如何将树型特征转换为矢量特征,machine-learning,feature-engineering,tree-structure,Machine Learning,Feature Engineering,Tree Structure,我有一个数据集,有几个特性,其中一个特性是分类的,但它的值有树结构。例如,如果该分类特征具有值a、b、c、d、e、f、g、h、I、j、k。然后下图显示了值的树关系: 原始要素不包含此关系(因此该要素只包含一列)。现在,我想合并这个关系,但我仍然希望特征是向量形式 我的解决方案是:为每个节点创建一个二进制值列。所以在这个例子中,特征可以用长度为11的二进制向量表示。并且等于e的特征值可以表示为(如下所示) 其中,第一个元素表示第一个b级;第二个元素表示第二级a;第三、第四、第五和第六元素分别表示

我有一个数据集,有几个特性,其中一个特性是分类的,但它的值有树结构。例如,如果该分类特征具有值a、b、c、d、e、f、g、h、I、j、k。然后下图显示了值的树关系:

原始要素不包含此关系(因此该要素只包含一列)。现在,我想合并这个关系,但我仍然希望特征是向量形式
我的解决方案是:为每个节点创建一个二进制值列。所以在这个例子中,特征可以用长度为11的二进制向量表示。并且等于e的特征值可以表示为(如下所示)
其中,第一个元素表示第一个b级;第二个元素表示第二级a;第三、第四、第五和第六元素分别表示第三级d、e、g和j;第7个元素表示第二级c;第8、第9、第10和第11个元素分别表示第三级f、h、i和k
我认为这会起作用的原因是你可以从这个向量表示中恢复树,所以我认为在这个转换过程中信息不会丢失
这个转换的主要目的是我想在这个数据集上使用一些机器学习算法,所以我希望数据集更具信息性
我想知道这个转换是否有效,如果无效,为什么?以及是否有更好的方法来做到这一点