R 如何筛选影响较大的变量并对其执行glm回归_R_Machine Learning_Statistics_Regression_Data Science

R 如何筛选影响较大的变量并对其执行glm回归

r machine-learning statistics

R 如何筛选影响较大的变量并对其执行glm回归,r,machine-learning,statistics,regression,data-science,R,Machine Learning,Statistics,Regression,Data Science,我有40个变量（分类变量和数字变量），响应变量是数字变量，我只想在R中对影响较大的变量执行glm回归。我遵循逐步向后回归来实现这一点，而这一选择似乎代价高昂，而且要花很长时间才能执行。除了强力法（逐步回归）之外，还有没有更好的方法过滤影响变量，以找到在R中只有显著影响变量的模型。没有更多信息，很难回答这个问题，但我建议您探索决策树。@user4970610在R中使用决策树对每个因素使用的级别数量有限制（即52）。但数据中的因素远不止这一限制。在喂食回归之前，我将那些水平更高的进行了聚类。经过一点

我有40个变量（分类变量和数字变量），响应变量是数字变量，我只想在R中对影响较大的变量执行glm回归。我遵循逐步向后回归来实现这一点，而这一选择似乎代价高昂，而且要花很长时间才能执行。除了强力法（逐步回归）之外，还有没有更好的方法过滤影响变量，以找到在R中只有显著影响变量的模型。

没有更多信息，很难回答这个问题，但我建议您探索决策树。@user4970610在R中使用决策树对每个因素使用的级别数量有限制（即52）。但数据中的因素远不止这一限制。在喂食回归之前，我将那些水平更高的进行了聚类。经过一点探索，套索似乎对变量选择更有效。必须检查其在数据上的性能。