Python 利用时间序列实现在线学习_Python_R_Machine Learning_Scikit Learn

Python 利用时间序列实现在线学习

python r machine-learning scikit-learn

Python 利用时间序列实现在线学习,python,r,machine-learning,scikit-learn,Python,R,Machine Learning,Scikit Learn,我对时间序列数据有一个分类问题每个示例都有10个变量，这些变量以不规则的间隔进行测量，最后将对象分类为2个可能类别中的1个（二进制分类）在培训期间，我只有最后一节课要学习。但是当给出一个新的例子时，我想在每个时间戳（以在线方式）进行预测。因此，如果新的例子有25个测量值，我想对它的类别做25个预测；每个时间戳一个目前我实现这一点的方法是使用10个变量的最小值、平均值和最大值作为分类特征。这是最优的吗？更好的方法是什么。如果您必须在每个时间戳进行预测，那么这不会成为时间序列问题（除非您计划使

我对时间序列数据有一个分类问题

每个示例都有10个变量，这些变量以不规则的间隔进行测量，最后将对象分类为2个可能类别中的1个（二进制分类）

在培训期间，我只有最后一节课要学习。但是当给出一个新的例子时，我想在每个时间戳（以在线方式）进行预测。因此，如果新的例子有25个测量值，我想对它的类别做25个预测；每个时间戳一个

目前我实现这一点的方法是使用10个变量的最小值、平均值和最大值作为分类特征。这是最优的吗？更好的方法是什么。

如果您必须在每个时间戳进行预测，那么这不会成为时间序列问题（除非您计划使用先前观测序列进行下一次预测，在这种情况下，您需要训练基于序列的模型）。假设你只能根据你观察到的最终数据来训练一个模型，可以有很多方法，但是我建议你使用随机森林，其中有大量的树，每个树中有3到4个变量。这样，即使某些变量不能提供所需的输入，其他树仍然可以做出相当准确的预测。除此之外，还有许多集成方法

您目前的做法可能是一种非常松散的近似和实用的方法，但没有太多统计意义。

因此，Timeseries严格地根据以前的值预测下一个值？假设我使用每个数据点的最终类训练RF，当我希望预测新示例的类时，对于RF的分类、10个变量的最小值、平均值和最大值，我应该输入哪些特征？集成方法的思想是，不使用所有变量来创建单个模型，而是使用变量的几个小子集来创建多个模型。。。因此，当你有一个数据，其中一些变量由于噪声而随时间波动时，组合模型将帮助你更准确地预测值。我们可以用这个来聊天吗？我想知道你对一些微妙之处的想法，同时预测每次你可以输入变量的实际值的时间戳。。。不需要最小最大值或平均值