Machine learning 特征选择技术

Machine learning 特征选择技术,machine-learning,statistics,data-science,data-analysis,feature-selection,Machine Learning,Statistics,Data Science,Data Analysis,Feature Selection,我对统计建模一无所知。我想知道什么是特征选择技术 假设我有10个变量,但我需要知道哪些是真正重要的变量 我在互联网上阅读了有关功能选择的内容,并了解了一些技术: 相关性 正向选择 反向消除 但我不明白我该如何使用它们。如何在特征选择中使用相关性。如何执行正向选择/反向消除等 我可以使用哪些型号进行功能选择。我只想对它有一个高层次的概述。什么时候用什么 有人帮助我开始相关性研究-在这种方法中,我们看到目标变量如何与预测值相关,并选择高度相关的变量,而忽略其他变量 正向选择-在这里,我们从0个预测值

我对统计建模一无所知。我想知道什么是特征选择技术

假设我有10个变量,但我需要知道哪些是真正重要的变量

我在互联网上阅读了有关功能选择的内容,并了解了一些技术:

  • 相关性
  • 正向选择
  • 反向消除
  • 但我不明白我该如何使用它们。如何在特征选择中使用相关性。如何执行正向选择/反向消除等

    我可以使用哪些型号进行功能选择。我只想对它有一个高层次的概述。什么时候用什么


    有人帮助我开始相关性研究-在这种方法中,我们看到目标变量如何与预测值相关,并选择高度相关的变量,而忽略其他变量

    正向选择-在这里,我们从0个预测值开始,并检查模型性能。然后在每个阶段,我们添加一个预测器,该预测器可以提供最佳的模型性能


    反向选择-在这里,我们从所有的预测开始。然后,在每个阶段,我们都会删除一个预测值,这会提供更好的模型性能。

    在反向选择、正向选择等过程中,我们是否必须手动添加/删除变量,或者有一些函数会自动添加/删除变量?当然,我们有一个用于所有内容的库。您可以使用正向和反向选择在R中为回归创建以下链接。对于相关性:我们如何计算两个变量之间是否存在线性关系(据我所知,相关性仅用于线性关系)在R中,成对图将显示每个变量之间的相关性。配对(testData)。相关性不仅仅适用于回归。它也可以用于分类。相关性也可以用来发现预测值之间的依赖关系。这是一个重要的问题,但是,它更适合stats.stackexchange.com。这就是说,根本没有办法改进尝试每一种变量组合以查看哪种方法最有效——其他方法是近似方法,通常运行速度要快得多。当你探索各种方法时,请记住这一点。@RobertDodier是的,即使是这样,它还是被否决了:(对“功能选择机器学习”的web搜索应该会找到很多资源。祝你好运,玩得开心,这是一个很好的主题。也许包含功能选择类的开源软件包可以作为起点:Scikit learn(),Feature engine()和mlxtend()。还可以查看这篇描述主要技术的文章: