Algorithm 时滞变量最优拟合多元回归模型的建立策略

Algorithm 时滞变量最优拟合多元回归模型的建立策略,algorithm,r,machine-learning,regression,Algorithm,R,Machine Learning,Regression,我正在建立一个多元回归模型——包装在一个函数中——有一个因变量和十几个自变量。我之所以要构建一个函数,是因为我需要对大约75个不同的数据集进行分析 挑战在于,当自变量在时间上滞后时,自变量与因变量的相关性更好。不幸的是,并非每个变量的所有时滞都相同,我想确定每个变量的最佳时滞组合,同时获得多元回归模型的最佳调整R^2值。此外,在构建初始模型后,我将尝试使用模型上的步骤(modelbase,direction=“both”)功能来简化模型 在目前的方法中,我对所有具有相同周数的自变量都有时滞。这就

我正在建立一个多元回归模型——包装在一个函数中——有一个因变量和十几个自变量。我之所以要构建一个函数,是因为我需要对大约75个不同的数据集进行分析

挑战在于,当自变量在时间上滞后时,自变量与因变量的相关性更好。不幸的是,并非每个变量的所有时滞都相同,我想确定每个变量的最佳时滞组合,同时获得多元回归模型的最佳调整R^2值。此外,在构建初始模型后,我将尝试使用模型上的
步骤(modelbase,direction=“both”)
功能来简化模型

在目前的方法中,我对所有具有相同周数的自变量都有时滞。这就产生了一个最好的模型,其中所有自变量都有相同的时滞,但我相信(有一个有效的假设支持这一点),当每个自变量的时滞不同时,会有一个更好的模型。我的问题是,在不增加选择数量的情况下,确定最佳拟合模型的最佳策略是什么。如果我想确定12个自变量的0到20周时间间隔,我很快就会找到4.096e+15个变量(=20^12)之间的匹配

我可以想象用以下策略来减少问题:首先,用一个独立变量在不同的时间滞后找到最佳拟合模型。第二步是添加具有不同时滞的第二个自变量,并找到具有两个自变量的最佳模型,其中第二个自变量在不同时滞下进行试验,而第一个自变量保持不变。然后添加第三个变量,我们采用与第二个变量类似的方法,保持前两个变量不变,并用不同的时间间隔更改第三个变量。有些东西告诉我,这个策略可能是一个不错的方法,但也可能有一个更好的整体模型,包含每个独立变量的非最优变量


有没有人对如何应对这一挑战有所启发

这可能更适合CrossValidated。@Thomas谢谢你的建议,也在那里发布了。你是在考虑ARIMA/box-jenkins模型,还是需要回归模型?@blast00我最初的兴趣是纯回归模型,但我可能会将其扩展到ARIMA模型左右。