Machine learning 确定数据分析中变量的重要性

Machine learning 确定数据分析中变量的重要性,machine-learning,data-analysis,Machine Learning,Data Analysis,我们通常如何确定数据集中的给定变量(特征)对于准确执行预测任务是否重要 应进行哪些测试并使用哪些测试来确定预测变量的适用性 假设我有32个特征,其中一个是“收入”,那么我应该如何开始分析它的重要性呢。将此功能与其他功能进行比较是否有任何用处,因为最终它是有助于预测的变量集合,而不是比较的这两个变量…从这里开始(尤其是段落功能选择教程和配方): 还有(列出了可用于进一步谷歌搜索的方法的数量): 这也是一篇很好的文章,对这个问题进行了更广泛的讨论: 另外,最简单的方法是尝试在数据集上安装随机森

我们通常如何确定数据集中的给定变量(特征)对于准确执行预测任务是否重要

应进行哪些测试并使用哪些测试来确定预测变量的适用性

假设我有32个特征,其中一个是“收入”,那么我应该如何开始分析它的重要性呢。将此功能与其他功能进行比较是否有任何用处,因为最终它是有助于预测的变量集合,而不是比较的这两个变量…

从这里开始(尤其是段落功能选择教程和配方):

还有(列出了可用于进一步谷歌搜索的方法的数量):

这也是一篇很好的文章,对这个问题进行了更广泛的讨论:

另外,最简单的方法是尝试在数据集上安装随机森林或梯度提升机。这些算法在拟合期间自动评估每个特征的重要性,在分类器或回归器拟合后,您可以访问(在scikit学习中)其
特征\u重要性\u
属性-