Python Scipy | Stats：迭代变量选择（根据AdjR2添加或删除特征）：回归_Python_Scipy_Statistics

Python Scipy | Stats：迭代变量选择（根据AdjR2添加或删除特征）：回归

python statistics

Python Scipy | Stats：迭代变量选择（根据AdjR2添加或删除特征）：回归,python,scipy,statistics,Python,Scipy,Statistics,我正在做一个项目，调查在airbnb数据集上预测每晚价格的能力。我的数据已经完全预处理，我已经选择了感兴趣的特征最终，如果您有可用的链接，请以代码为例寻找一篇论文总共有24列，因此23个相关变量和1个独立变量price 我想根据它对调整R2的影响，从模型中添加和删除变量，并且只希望在改进调整R2的情况下保留感兴趣的特性我的目标是在用户定义的功能下完成此任务： df=[] predictors= [] #features target=[] # price alpha=[] de

我正在做一个项目，调查在airbnb数据集上预测每晚价格的能力。我的数据已经完全预处理，我已经选择了感兴趣的特征

最终，如果您有可用的链接，请以代码为例寻找一篇论文

总共有24列，因此23个相关变量和1个独立变量

price

我想根据它对调整R2的影响，从模型中添加和删除变量，并且只希望在改进调整R2的情况下保留感兴趣的特性

我的目标是在用户定义的功能下完成此任务：

df=[]
predictors= [] #features
target=[]  # price
alpha=[]  

def variable_selection (df, predictors, target, alpha)
   return pred

问题是，我想从一个变量回归模型开始，然后添加另一个来自预测因子的特性，然后添加导致AdjR2最大增长的特性。然后添加下一个和第四个变量，直到没有增加AdjR2的变量

非常感谢你走了这么远。祝你万事如意

数据集有多大？有

sum（[scipy.special.comb（23，i）表示范围（1,24）]）=8_388_607.0

潜在输入矩阵的组合。一台计算机（可能）能比我能想出一个智能算法快出800万次回归。大约17000行，24列。我已经很感谢你的意见。我像猴子一样坐在这里，我一直在想办法解决这个问题。不用说，没有任何进展。我可以写几个专栏，但不多。如果这是一个限制，可能最多5个。只想在回归中添加一个特性，逐1迭代，直到adj R2达到给定变量的最大潜力model@DavidKaften目前正在查看以下文档：如果您从：，获得关于如何迭代变量的任何建议，将不胜感激