Python Scipy | Stats:迭代变量选择(根据AdjR2添加或删除特征):回归
我正在做一个项目,调查在airbnb数据集上预测每晚价格的能力。我的数据已经完全预处理,我已经选择了感兴趣的特征 最终,如果您有可用的链接,请以代码为例寻找一篇论文 总共有24列,因此23个相关变量和1个独立变量Python Scipy | Stats:迭代变量选择(根据AdjR2添加或删除特征):回归,python,scipy,statistics,Python,Scipy,Statistics,我正在做一个项目,调查在airbnb数据集上预测每晚价格的能力。我的数据已经完全预处理,我已经选择了感兴趣的特征 最终,如果您有可用的链接,请以代码为例寻找一篇论文 总共有24列,因此23个相关变量和1个独立变量price 我想根据它对调整R2的影响,从模型中添加和删除变量,并且只希望在改进调整R2的情况下保留感兴趣的特性 我的目标是在用户定义的功能下完成此任务: df=[] predictors= [] #features target=[] # price alpha=[] de
price
我想根据它对调整R2的影响,从模型中添加和删除变量,并且只希望在改进调整R2的情况下保留感兴趣的特性
我的目标是在用户定义的功能下完成此任务:
df=[]
predictors= [] #features
target=[] # price
alpha=[]
def variable_selection (df, predictors, target, alpha)
return pred
问题是,我想从一个变量回归模型开始,然后添加另一个来自预测因子的特性,然后添加导致AdjR2最大增长的特性。然后添加下一个和第四个变量,直到没有增加AdjR2的变量
非常感谢你走了这么远。祝你万事如意数据集有多大?有
sum([scipy.special.comb(23,i)表示范围(1,24)])=8_388_607.0
潜在输入矩阵的组合。一台计算机(可能)能比我能想出一个智能算法快出800万次回归。大约17000行,24列。我已经很感谢你的意见。我像猴子一样坐在这里,我一直在想办法解决这个问题。不用说,没有任何进展。我可以写几个专栏,但不多。如果这是一个限制,可能最多5个。只想在回归中添加一个特性,逐1迭代,直到adj R2达到给定变量的最大潜力model@DavidKaften目前正在查看以下文档:如果您从:,获得关于如何迭代变量的任何建议,将不胜感激