Machine learning 如何将树型特征转换为矢量特征_Machine Learning_Feature Engineering_Tree Structure

Machine learning 如何将树型特征转换为矢量特征

machine-learning

Machine learning 如何将树型特征转换为矢量特征,machine-learning,feature-engineering,tree-structure,Machine Learning,Feature Engineering,Tree Structure,我有一个数据集，有几个特性，其中一个特性是分类的，但它的值有树结构。例如，如果该分类特征具有值a、b、c、d、e、f、g、h、I、j、k。然后下图显示了值的树关系：原始要素不包含此关系（因此该要素只包含一列）。现在，我想合并这个关系，但我仍然希望特征是向量形式我的解决方案是：为每个节点创建一个二进制值列。所以在这个例子中，特征可以用长度为11的二进制向量表示。并且等于e的特征值可以表示为（如下所示）其中，第一个元素表示第一个b级；第二个元素表示第二级a；第三、第四、第五和第六元素分别表示

我有一个数据集，有几个特性，其中一个特性是分类的，但它的值有树结构。例如，如果该分类特征具有值a、b、c、d、e、f、g、h、I、j、k。然后下图显示了值的树关系：

原始要素不包含此关系（因此该要素只包含一列）。现在，我想合并这个关系，但我仍然希望特征是向量形式
我的解决方案是：为每个节点创建一个二进制值列。所以在这个例子中，特征可以用长度为11的二进制向量表示。并且等于e的特征值可以表示为（如下所示）
其中，第一个元素表示第一个b级；第二个元素表示第二级a；第三、第四、第五和第六元素分别表示第三级d、e、g和j；第7个元素表示第二级c；第8、第9、第10和第11个元素分别表示第三级f、h、i和k
我认为这会起作用的原因是你可以从这个向量表示中恢复树，所以我认为在这个转换过程中信息不会丢失
这个转换的主要目的是我想在这个数据集上使用一些机器学习算法，所以我希望数据集更具信息性
我想知道这个转换是否有效，如果无效，为什么？以及是否有更好的方法来做到这一点