Python 要预测罕见事件分类，是否有；“更简单”；比使用LSTM Keras更有效的方法？_Python_Machine Learning_Keras_Deep Learning_Lstm

Python 要预测罕见事件分类，是否有；“更简单”；比使用LSTM Keras更有效的方法？

python machine-learning keras deep-learning

Python 要预测罕见事件分类，是否有；“更简单”；比使用LSTM Keras更有效的方法？,python,machine-learning,keras,deep-learning,lstm,Python,Machine Learning,Keras,Deep Learning,Lstm,我目前正在研究罕见事件预测，这是我以前从未做过的（我曾经处理过简单的预测问题），我还研究了如何使用LSTM进行时间序列罕见事件分类读到这篇文章非常激动人心，因为我认为我的案例有点类似：预测奶牛的产犊时间，具有历史活动特征，在数据收集结束时产犊只发生一次然而。。。除了我的数据比示例小之外，我在使用LSTM时遇到了太多的困惑。我期待的LSTM的一个优点是“回顾”功能，它可以让您为每个输出决定上一次回顾的输入数量我的问题是：是否有任何“更简单”或更简单的机器学习方法可以像LSTM那样用于时间序列

我目前正在研究罕见事件预测，这是我以前从未做过的（我曾经处理过简单的预测问题），我还研究了如何使用LSTM进行时间序列罕见事件分类

读到这篇文章非常激动人心，因为我认为我的案例有点类似：预测奶牛的产犊时间，具有历史活动特征，在数据收集结束时产犊只发生一次

然而。。。除了我的数据比示例小之外，我在使用LSTM时遇到了太多的困惑。我期待的LSTM的一个优点是“回顾”功能，它可以让您为每个输出决定上一次回顾的输入数量

我的问题是：是否有任何“更简单”或更简单的机器学习方法可以像LSTM那样用于时间序列分类

我尝试使用简单的ML，如决策树、随机林，但我认为它不能很好地反映问题（将许多历史数据转换为一个输出）

这个问题也在StackExchange上交叉发布。我知道我应该在这里问更多与编程相关的问题，但任何帮助/见解都将不胜感激

许多机器学习项目/程序的问题在于缺少数据，您已经说明了这是您不希望使用LSTM的原因之一。不仅对于LSTM（尽管这些方法也会受到很大的影响），而且对于其他方法，您也会遇到一些问题，例如数据拟合过度、对异常值的重视程度更高等，这些问题实际上只能通过更多数据（或参数微调）来解决

您可以研究的一个选项是合成数据生成，或者使用不同的方法来扩展数据集。这样，您仍然可以使用LSTM，因为它将有更多的数据可以运行

我将链接到一个我发现有助于用小数据解决问题的网站。你最好的选择是使用一个简单的，或者更基本的ML方法（线性回归就是一个例子）

如果您想尝试将罕见的预测从更标准的模式中分离出来（不太了解您的数据集，所以很难说），您可以尝试使用支持向量机

如果你想找出方差，即罕见预测，你也可以尝试使用主成分分析，看看方差最大的地方

同样，我建议的方法在很大程度上取决于您的数据集，我不确定它们对您的时间序列数据有多有效。找到一种扩大数据集的方法将是更好的选择

让我知道这是否有用

你可以试试ARMA系列的模型。当你说“更容易”时，你是指你的计算机处理能力更便宜的东西吗？@Andrew我想，它更适合处理较小的数据集，更容易理解它如何处理我的数据。