R 如何筛选影响较大的变量并对其执行glm回归

R 如何筛选影响较大的变量并对其执行glm回归,r,machine-learning,statistics,regression,data-science,R,Machine Learning,Statistics,Regression,Data Science,我有40个变量(分类变量和数字变量),响应变量是数字变量,我只想在R中对影响较大的变量执行glm回归。我遵循逐步向后回归来实现这一点,而这一选择似乎代价高昂,而且要花很长时间才能执行。除了强力法(逐步回归)之外,还有没有更好的方法过滤影响变量,以找到在R中只有显著影响变量的模型。没有更多信息,很难回答这个问题,但我建议您探索决策树。@user4970610在R中使用决策树对每个因素使用的级别数量有限制(即52)。但数据中的因素远不止这一限制。在喂食回归之前,我将那些水平更高的进行了聚类。经过一点

我有40个变量(分类变量和数字变量),响应变量是数字变量,我只想在R中对影响较大的变量执行glm回归。我遵循逐步向后回归来实现这一点,而这一选择似乎代价高昂,而且要花很长时间才能执行。除了强力法(逐步回归)之外,还有没有更好的方法过滤影响变量,以找到在R中只有显著影响变量的模型。

没有更多信息,很难回答这个问题,但我建议您探索决策树。@user4970610在R中使用决策树对每个因素使用的级别数量有限制(即52)。但数据中的因素远不止这一限制。在喂食回归之前,我将那些水平更高的进行了聚类。经过一点探索,套索似乎对变量选择更有效。必须检查其在数据上的性能。