Python 有缺口的数据集的深度学习训练
我有一个传感器(站)的数据集,使用这种结构已经有好几年了:Python 有缺口的数据集的深度学习训练,python,deep-learning,lstm,Python,Deep Learning,Lstm,我有一个传感器(站)的数据集,使用这种结构已经有好几年了: station Direction year month day dayOfweek hour volume 1009 3 2015 1 1 5 0 37 1009 3 2015 1 1 5 1 20 1009 3 201
station Direction year month day dayOfweek hour volume
1009 3 2015 1 1 5 0 37
1009 3 2015 1 1 5 1 20
1009 3 2015 1 1 5 2 24
... . .. .. .. .. .. ..
该数据中存在大量缺口(遗漏值)。例如,可能会错过一个月或几天。我用0填充丢失的卷。我想根据以前的数据预测销量。我使用了LSTM,平均绝对百分比误差(MAPE)在20左右相当高,我需要减少它
我的主要问题是,即使是训练我也有差距。对于这类数据,在深度学习中还有其他技术吗?这里列出了多种处理缺失值的方法() 如果我有足够的数据,我将只删除缺少数据的行。如果我没有足够的数据和/或必须预测数据缺失的情况,我通常会尝试这两种方法,并选择精度较高的方法 和你一样。我选择一个不包含在数据集中的不同值,如您案例中的0,并填充该值。另一种方法是使用训练集的平均值或中位数。我在验证集/测试集中使用相同的值(在训练集上计算)。如果平均值在当前上下文中没有意义,则中位数优于平均值。(以2014.5年为例)