Python 要预测罕见事件分类,是否有;“更简单”;比使用LSTM Keras更有效的方法?

Python 要预测罕见事件分类,是否有;“更简单”;比使用LSTM Keras更有效的方法?,python,machine-learning,keras,deep-learning,lstm,Python,Machine Learning,Keras,Deep Learning,Lstm,我目前正在研究罕见事件预测,这是我以前从未做过的(我曾经处理过简单的预测问题),我还研究了如何使用LSTM进行时间序列罕见事件分类 读到这篇文章非常激动人心,因为我认为我的案例有点类似:预测奶牛的产犊时间,具有历史活动特征,在数据收集结束时产犊只发生一次 然而。。。除了我的数据比示例小之外,我在使用LSTM时遇到了太多的困惑。我期待的LSTM的一个优点是“回顾”功能,它可以让您为每个输出决定上一次回顾的输入数量 我的问题是:是否有任何“更简单”或更简单的机器学习方法可以像LSTM那样用于时间序列

我目前正在研究罕见事件预测,这是我以前从未做过的(我曾经处理过简单的预测问题),我还研究了如何使用LSTM进行时间序列罕见事件分类

读到这篇文章非常激动人心,因为我认为我的案例有点类似:预测奶牛的产犊时间,具有历史活动特征,在数据收集结束时产犊只发生一次

然而。。。除了我的数据比示例小之外,我在使用LSTM时遇到了太多的困惑。我期待的LSTM的一个优点是“回顾”功能,它可以让您为每个输出决定上一次回顾的输入数量

我的问题是:是否有任何“更简单”或更简单的机器学习方法可以像LSTM那样用于时间序列分类

我尝试使用简单的ML,如决策树、随机林,但我认为它不能很好地反映问题(将许多历史数据转换为一个输出)


这个问题也在StackExchange上交叉发布。我知道我应该在这里问更多与编程相关的问题,但任何帮助/见解都将不胜感激

许多机器学习项目/程序的问题在于缺少数据,您已经说明了这是您不希望使用LSTM的原因之一。不仅对于LSTM(尽管这些方法也会受到很大的影响),而且对于其他方法,您也会遇到一些问题,例如数据拟合过度、对异常值的重视程度更高等,这些问题实际上只能通过更多数据(或参数微调)来解决

您可以研究的一个选项是合成数据生成,或者使用不同的方法来扩展数据集。这样,您仍然可以使用LSTM,因为它将有更多的数据可以运行

我将链接到一个我发现有助于用小数据解决问题的网站。你最好的选择是使用一个简单的,或者更基本的ML方法(线性回归就是一个例子)

如果您想尝试将罕见的预测从更标准的模式中分离出来(不太了解您的数据集,所以很难说),您可以尝试使用支持向量机

如果你想找出方差,即罕见预测,你也可以尝试使用主成分分析,看看方差最大的地方

同样,我建议的方法在很大程度上取决于您的数据集,我不确定它们对您的时间序列数据有多有效。找到一种扩大数据集的方法将是更好的选择


让我知道这是否有用

你可以试试ARMA系列的模型。当你说“更容易”时,你是指你的计算机处理能力更便宜的东西吗?@Andrew我想,它更适合处理较小的数据集,更容易理解它如何处理我的数据。