Python 多特征多步时间序列预测

Python 多特征多步时间序列预测,python,machine-learning,keras,time-series,Python,Machine Learning,Keras,Time Series,所以我是机器学习的初学者,我想预测时间序列的多个样本。 时间序列每15分钟包含一次样本,我必须预测未来3天的样本。因此,未来大约有288个样本 我的时间序列还有其他分类特性,所以我根据答案实现了一个模型 我读过关于seq2seq时间序列预测的编码器-解码器。但是对于如何实现它以及如何将它与多个分类特性结合起来,我不太了解 我按照这个答案走对了方向吗 即使在Y的大维度上,LSTM也能正常工作吗(在我的例子中,是未来288个时间步) 我认为最后7天的样本是X,所以我的lstm输入形状是(样本数,67

所以我是机器学习的初学者,我想预测时间序列的多个样本。 时间序列每15分钟包含一次样本,我必须预测未来3天的样本。因此,未来大约有288个样本

我的时间序列还有其他分类特性,所以我根据答案实现了一个模型

我读过关于seq2seq时间序列预测的编码器-解码器。但是对于如何实现它以及如何将它与多个分类特性结合起来,我不太了解

  • 我按照这个答案走对了方向吗
  • 即使在Y的大维度上,LSTM也能正常工作吗(在我的例子中,是未来288个时间步)
  • 我认为最后7天的样本是X,所以我的lstm输入形状是(样本数,672,1)。可以吗
  • 我应该选择编码器-解码器吗?如果是的话,那么谁能给我提供一些更多的见解,也许是一个很好的教程
  • 提前谢谢

  • 这取决于您拥有的数据量以及您的问题的可学习性
  • 使用的数据越多越好
  • 编码器-解码器架构只是“前馈隐藏的LSTM状态”的一个花哨名称。我看不出你为什么要在你的案件中使用它

  • 听起来像个计划。你可能想看看这个,这不是什么突破性的东西,但如果你不确定自己在做什么,它可能会帮助你解除障碍。谢谢你的快速回答。我有过去1年的可用数据,但现在我只使用1个月的数据进行快速培训,以检查结果,否则会花费太多时间。一旦模型最终确定,我将使用所有数据。我的数据是表格格式,每个时间步有一行。目前我的输入形状是(2190672,1)。你说的更多数据是什么意思?如果我不增加样本,即2190,还是应该考虑过去的更多数据来预测下一个样本。i、 e.672?我已经爬过了那个网站,但我还是觉得不太自信。你能建议我应该使用多少细胞单位吗?作为一个新手,我相信隐藏单元应该高于Y维度,所以它应该大于288,应该是2次方,所以我应该相信512个单元可以工作吗?或者任何小于2次方的都可以,因为你说的是预测,我假设除了你过去的值,你没有更多的预测可以使用,所以我看不到增加特征空间的方法。但是,如果您假设变化模式是暂时不变的(即,您的数据仅根据最后N个时间步的值随时间变化),那么您仍然可以使用您的远古数据预测其未来对应数据(即使用12个月前的数据预测11个月前的“未来”值)。这将增加您的样品数量。或者,你可以增加回溯时间。在任何情况下,都没有保证最佳结果的标准方法,因此你必须遵循反复试验的方法,看看哪种方法最有效。