Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/309.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 有缺口的数据集的深度学习训练_Python_Deep Learning_Lstm - Fatal编程技术网

Python 有缺口的数据集的深度学习训练

Python 有缺口的数据集的深度学习训练,python,deep-learning,lstm,Python,Deep Learning,Lstm,我有一个传感器(站)的数据集,使用这种结构已经有好几年了: station Direction year month day dayOfweek hour volume 1009 3 2015 1 1 5 0 37 1009 3 2015 1 1 5 1 20 1009 3 201

我有一个传感器(站)的数据集,使用这种结构已经有好几年了:

station Direction   year    month   day dayOfweek   hour    volume
  1009       3      2015      1      1      5        0        37
  1009       3      2015      1      1      5        1        20
  1009       3      2015      1      1      5        2        24
   ...       .       ..       ..     ..     ..       ..       ..
该数据中存在大量缺口(遗漏值)。例如,可能会错过一个月或几天。我用0填充丢失的卷。我想根据以前的数据预测销量。我使用了LSTM,平均绝对百分比误差(MAPE)在20左右相当高,我需要减少它


我的主要问题是,即使是训练我也有差距。对于这类数据,在深度学习中还有其他技术吗?

这里列出了多种处理缺失值的方法()

如果我有足够的数据,我将只删除缺少数据的行。如果我没有足够的数据和/或必须预测数据缺失的情况,我通常会尝试这两种方法,并选择精度较高的方法

和你一样。我选择一个不包含在数据集中的不同值,如您案例中的0,并填充该值。另一种方法是使用训练集的平均值或中位数。我在验证集/测试集中使用相同的值(在训练集上计算)。如果平均值在当前上下文中没有意义,则中位数优于平均值。(以2014.5年为例)