Variables 确定WEKA中各个变量的重要性
我试图确定单个变量在LMT(逻辑模型树)DT(决策树)的WEKA实现中的重要性 我想知道每个变量在分类任务中的贡献,因此需要确定每个变量的重要性。这是为了对我的结果进行更深入的分析 我已经查看了“选择属性”选项卡和相应的算法(即主成分、信息增益、Ranker等);然而,这些算法提供了关于哪些组合或变量等级将有助于最佳(或最有效,或最快,取决于您的最终目标,分类器)的信息 然而,我对排名或选择最重要的变量不感兴趣。我感兴趣的是确定每个变量对我的DT最终分类分数的贡献程度(例如,以百分比形式) 我已经考虑过逐个删除每个变量,以确定分数如何变化;但我不确定这是否可以手动完成,因为最终分数可能取决于一些潜在的相关性,这就是为什么我希望将所有变量一起使用(即使其中一个变量的贡献为零)来确定 所以,问题是:有没有办法测量分类器中使用的每个单独变量的贡献(即使贡献为零)Variables 确定WEKA中各个变量的重要性,variables,weka,decision-tree,significance,Variables,Weka,Decision Tree,Significance,我试图确定单个变量在LMT(逻辑模型树)DT(决策树)的WEKA实现中的重要性 我想知道每个变量在分类任务中的贡献,因此需要确定每个变量的重要性。这是为了对我的结果进行更深入的分析 我已经查看了“选择属性”选项卡和相应的算法(即主成分、信息增益、Ranker等);然而,这些算法提供了关于哪些组合或变量等级将有助于最佳(或最有效,或最快,取决于您的最终目标,分类器)的信息 然而,我对排名或选择最重要的变量不感兴趣。我感兴趣的是确定每个变量对我的DT最终分类分数的贡献程度(例如,以百分比形式) 我已
提前感谢您的帮助。以下是一些询问和研究的答案。 事实上,信息增益不是一种概率。此属性选择器的结果仅提供有关要素对“纯”分类贡献的信息量的信息(整数(0-1)) 例如,InfoGain值为1的功能意味着该功能中的所有可用信息都有助于分类,但这并不意味着仅使用该提示就能够进行整个分类
在许多情况下,分类是不同特征相关性的结果(至少在我的决策树经验中是这样)。因此,分析每个决策的路径以达到分类是通过其相关性检测线索贡献的一种方法。信息增益算法将每个特征或属性作为一个单独的实体进行评估,而不考虑它与其他属性相结合来决定类成员身份。以下是一些查询和研究的答案。 事实上,信息增益不是一种概率。此属性选择器的结果仅提供有关要素对“纯”分类贡献的信息量的信息(整数(0-1)) 例如,InfoGain值为1的功能意味着该功能中的所有可用信息都有助于分类,但这并不意味着仅使用该提示就能够进行整个分类 在许多情况下,分类是不同特征相关性的结果(至少在我的决策树经验中是这样)。因此,分析每个决策的路径以达到分类是通过其相关性检测线索贡献的一种方法。信息增益算法将每个特征或属性作为一个单独的实体进行评估,而不考虑它与其他属性相结合以决定类成员资格