Deep learning 用LSTM自动编码器预测罕见事件及其强度

Deep learning 用LSTM自动编码器预测罕见事件及其强度,deep-learning,time-series,lstm,feature-extraction,autoencoder,Deep Learning,Time Series,Lstm,Feature Extraction,Autoencoder,我目前正在创建和LSTM来预测罕见事件。我看过一篇论文,其中建议:首先是一个用于提取特征的自动编码器LSTM,其次是使用嵌入的第二个LSTM来进行实际预测。根据他们的说法,自动编码器提取特征(这通常是真的),然后这些特征对预测层预测有用 在我的例子中,我需要预测它是否是一个极端事件(这是最重要的事情),然后预测它的强度。按照他们的建议,我创建了这个模型,但不是从嵌入到预测中添加一个LSTM,而是添加了两个。一个用于二元预测(是或不是),以一个sigmoid层结束,第二个用于预测强度。那我就输了三

我目前正在创建和LSTM来预测罕见事件。我看过一篇论文,其中建议:首先是一个用于提取特征的自动编码器LSTM,其次是使用嵌入的第二个LSTM来进行实际预测。根据他们的说法,自动编码器提取特征(这通常是真的),然后这些特征对预测层预测有用

在我的例子中,我需要预测它是否是一个极端事件(这是最重要的事情),然后预测它的强度。按照他们的建议,我创建了这个模型,但不是从嵌入到预测中添加一个LSTM,而是添加了两个。一个用于二元预测(是或不是),以一个sigmoid层结束,第二个用于预测强度。那我就输了三场。重建损失(MSE)、预测损失(MSE)和二元损失(二元熵)

问题是,我不确定这是否在学习任何东西……二进制损失保持在0.5,甚至重建损失也不是很好。当然,坏的是时间序列中有很多0,一些数字是从1到10,所以MSE绝对不是一个好的指标

你认为这种方法怎么样

  • 这是预测罕见事件的更好架构吗?哪一个更好
  • 我应该在嵌入之前添加一些CNN或FC到LSTM中,以便从嵌入中提取1D模式,还是直接进行预测
  • 预测的LSTM应该只有一个吗?仅使用MSE损耗
  • 将这两个预测相乘是一个好主意,以迫使在这两种情况下预测的无事件天数重合
  • 谢谢