Python 利用时间序列实现在线学习

Python 利用时间序列实现在线学习,python,r,machine-learning,scikit-learn,Python,R,Machine Learning,Scikit Learn,我对时间序列数据有一个分类问题 每个示例都有10个变量,这些变量以不规则的间隔进行测量,最后将对象分类为2个可能类别中的1个(二进制分类) 在培训期间,我只有最后一节课要学习。但是当给出一个新的例子时,我想在每个时间戳(以在线方式)进行预测。因此,如果新的例子有25个测量值,我想对它的类别做25个预测;每个时间戳一个 目前我实现这一点的方法是使用10个变量的最小值、平均值和最大值作为分类特征。这是最优的吗?更好的方法是什么。如果您必须在每个时间戳进行预测,那么这不会成为时间序列问题(除非您计划使

我对时间序列数据有一个分类问题

每个示例都有10个变量,这些变量以不规则的间隔进行测量,最后将对象分类为2个可能类别中的1个(二进制分类)

在培训期间,我只有最后一节课要学习。但是当给出一个新的例子时,我想在每个时间戳(以在线方式)进行预测。因此,如果新的例子有25个测量值,我想对它的类别做25个预测;每个时间戳一个


目前我实现这一点的方法是使用10个变量的最小值、平均值和最大值作为分类特征。这是最优的吗?更好的方法是什么。

如果您必须在每个时间戳进行预测,那么这不会成为时间序列问题(除非您计划使用先前观测序列进行下一次预测,在这种情况下,您需要训练基于序列的模型)。假设你只能根据你观察到的最终数据来训练一个模型,可以有很多方法,但是我建议你使用随机森林,其中有大量的树,每个树中有3到4个变量。这样,即使某些变量不能提供所需的输入,其他树仍然可以做出相当准确的预测。除此之外,还有许多集成方法


您目前的做法可能是一种非常松散的近似和实用的方法,但没有太多统计意义。

因此,Timeseries严格地根据以前的值预测下一个值?假设我使用每个数据点的最终类训练RF,当我希望预测新示例的类时,对于RF的分类、10个变量的最小值、平均值和最大值,我应该输入哪些特征?集成方法的思想是,不使用所有变量来创建单个模型,而是使用变量的几个小子集来创建多个模型。。。因此,当你有一个数据,其中一些变量由于噪声而随时间波动时,组合模型将帮助你更准确地预测值。我们可以用这个来聊天吗?我想知道你对一些微妙之处的想法,同时预测每次你可以输入变量的实际值的时间戳。。。不需要最小最大值或平均值