时间序列中的Python滞后回归

时间序列中的Python滞后回归,python,scikit-learn,time-series,regression,Python,Scikit Learn,Time Series,Regression,我是一个使用Python和Scikit进行预测的新手,在这里学习并寻找一些指导 我有一个数据集,它存储在一个名为“predictor”的数组中。 我还有另一个数据集,它存储在一个名为“to_be_predicted”的数组中 我知道“预测器”中的值可以使用正确的回归以相当高的效率预测“待预测”中的值,但是我不确定“预测器”最能预测“待预测”,换句话说,“预测器”和“待预测”之间的延迟是多少。可能是1,2,3,100,1000个周期,我只是不知道 为了找到答案,我可以在一个确定的范围内对每个预测期

我是一个使用Python和Scikit进行预测的新手,在这里学习并寻找一些指导

我有一个数据集,它存储在一个名为“predictor”的数组中。 我还有另一个数据集,它存储在一个名为“to_be_predicted”的数组中

我知道“预测器”中的值可以使用正确的回归以相当高的效率预测“待预测”中的值,但是我不确定“预测器”最能预测“待预测”,换句话说,“预测器”和“待预测”之间的延迟是多少。可能是1,2,3,100,1000个周期,我只是不知道

为了找到答案,我可以在一个确定的范围内对每个预测期进行一次回归,并在每次回归中使用一些误差度量来找出哪个是最佳预测


我的问题是:有没有一个函数库在两个时间序列之间的最佳延迟之后运行?

您是否仅限于一个预测值?为什么滞后(3)和滞后(10)不能都是预测因子?它们可以,但我有将近50个“主要预测因子”,每个都有大约500个项目。如果我对每个应用30个延迟,那么将有75万个项目需要处理,我担心这对我的macbook air来说太多了,而且我将被限制为最多30个延迟。这就是为什么我想知道是否有任何库具有识别最佳滞后的函数:)第一步是查看两个时间序列的平均值。一位相关人士建议看一下包装