Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/365.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Scipy | Stats:迭代变量选择(根据AdjR2添加或删除特征):回归_Python_Scipy_Statistics - Fatal编程技术网

Python Scipy | Stats:迭代变量选择(根据AdjR2添加或删除特征):回归

Python Scipy | Stats:迭代变量选择(根据AdjR2添加或删除特征):回归,python,scipy,statistics,Python,Scipy,Statistics,我正在做一个项目,调查在airbnb数据集上预测每晚价格的能力。我的数据已经完全预处理,我已经选择了感兴趣的特征 最终,如果您有可用的链接,请以代码为例寻找一篇论文 总共有24列,因此23个相关变量和1个独立变量price 我想根据它对调整R2的影响,从模型中添加和删除变量,并且只希望在改进调整R2的情况下保留感兴趣的特性 我的目标是在用户定义的功能下完成此任务: df=[] predictors= [] #features target=[] # price alpha=[] de

我正在做一个项目,调查在airbnb数据集上预测每晚价格的能力。我的数据已经完全预处理,我已经选择了感兴趣的特征

最终,如果您有可用的链接,请以代码为例寻找一篇论文

总共有24列,因此23个相关变量和1个独立变量
price

我想根据它对调整R2的影响,从模型中添加和删除变量,并且只希望在改进调整R2的情况下保留感兴趣的特性

我的目标是在用户定义的功能下完成此任务:

df=[]
predictors= [] #features
target=[]  # price
alpha=[]  

def variable_selection (df, predictors, target, alpha)
   return pred
问题是,我想从一个变量回归模型开始,然后添加另一个来自预测因子的特性,然后添加导致AdjR2最大增长的特性。然后添加下一个和第四个变量,直到没有增加AdjR2的变量


非常感谢你走了这么远。祝你万事如意

数据集有多大?有
sum([scipy.special.comb(23,i)表示范围(1,24)])=8_388_607.0
潜在输入矩阵的组合。一台计算机(可能)能比我能想出一个智能算法快出800万次回归。大约17000行,24列。我已经很感谢你的意见。我像猴子一样坐在这里,我一直在想办法解决这个问题。不用说,没有任何进展。我可以写几个专栏,但不多。如果这是一个限制,可能最多5个。只想在回归中添加一个特性,逐1迭代,直到adj R2达到给定变量的最大潜力model@DavidKaften目前正在查看以下文档:如果您从:,获得关于如何迭代变量的任何建议,将不胜感激