Algorithm 时滞变量最优拟合多元回归模型的建立策略_Algorithm_R_Machine Learning_Regression

Algorithm 时滞变量最优拟合多元回归模型的建立策略

algorithm r machine-learning

Algorithm 时滞变量最优拟合多元回归模型的建立策略,algorithm,r,machine-learning,regression,Algorithm,R,Machine Learning,Regression,我正在建立一个多元回归模型——包装在一个函数中——有一个因变量和十几个自变量。我之所以要构建一个函数，是因为我需要对大约75个不同的数据集进行分析挑战在于，当自变量在时间上滞后时，自变量与因变量的相关性更好。不幸的是，并非每个变量的所有时滞都相同，我想确定每个变量的最佳时滞组合，同时获得多元回归模型的最佳调整R^2值。此外，在构建初始模型后，我将尝试使用模型上的步骤（modelbase，direction=“both”）功能来简化模型在目前的方法中，我对所有具有相同周数的自变量都有时滞。这就

我正在建立一个多元回归模型——包装在一个函数中——有一个因变量和十几个自变量。我之所以要构建一个函数，是因为我需要对大约75个不同的数据集进行分析

挑战在于，当自变量在时间上滞后时，自变量与因变量的相关性更好。不幸的是，并非每个变量的所有时滞都相同，我想确定每个变量的最佳时滞组合，同时获得多元回归模型的最佳调整R^2值。此外，在构建初始模型后，我将尝试使用模型上的

步骤（modelbase，direction=“both”）

功能来简化模型

在目前的方法中，我对所有具有相同周数的自变量都有时滞。这就产生了一个最好的模型，其中所有自变量都有相同的时滞，但我相信（有一个有效的假设支持这一点），当每个自变量的时滞不同时，会有一个更好的模型。我的问题是，在不增加选择数量的情况下，确定最佳拟合模型的最佳策略是什么。如果我想确定12个自变量的0到20周时间间隔，我很快就会找到4.096e+15个变量（=20^12）之间的匹配

我可以想象用以下策略来减少问题：首先，用一个独立变量在不同的时间滞后找到最佳拟合模型。第二步是添加具有不同时滞的第二个自变量，并找到具有两个自变量的最佳模型，其中第二个自变量在不同时滞下进行试验，而第一个自变量保持不变。然后添加第三个变量，我们采用与第二个变量类似的方法，保持前两个变量不变，并用不同的时间间隔更改第三个变量。有些东西告诉我，这个策略可能是一个不错的方法，但也可能有一个更好的整体模型，包含每个独立变量的非最优变量

有没有人对如何应对这一挑战有所启发

这可能更适合CrossValidated。@Thomas谢谢你的建议，也在那里发布了。你是在考虑ARIMA/box-jenkins模型，还是需要回归模型？@blast00我最初的兴趣是纯回归模型，但我可能会将其扩展到ARIMA模型左右。