Machine learning 动态环境下的机器学习算法

Machine learning 动态环境下的机器学习算法,machine-learning,data-mining,supervised-learning,unsupervised-learning,anomaly-detection,Machine Learning,Data Mining,Supervised Learning,Unsupervised Learning,Anomaly Detection,在动态环境中,哪些方法最适合管理、预测和标记数据?系统数据分布发生变化,并且不是静态的。系统可以有不同的正态设置,在不同的设置下,我们有不同的正态数据分布。我们有两个班。正常和不正常。会发生什么?我们不能说我们可以依赖历史数据并训练一种简单的分类方法来预测未来的观测结果,因为在训练模型一天后,数据分布会发生变化,旧的观测结果将与新的观测结果无关。考虑下面的数字: 蓝色分布和红色分布是正态数据,但在不同的设置下,在训练时间内,我们只有一个设置。此数据针对一个传感器。因此,假设我们训练了一个蓝色的

在动态环境中,哪些方法最适合管理、预测和标记数据?系统数据分布发生变化,并且不是静态的。系统可以有不同的正态设置,在不同的设置下,我们有不同的正态数据分布。我们有两个班。正常和不正常。会发生什么?我们不能说我们可以依赖历史数据并训练一种简单的分类方法来预测未来的观测结果,因为在训练模型一天后,数据分布会发生变化,旧的观测结果将与新的观测结果无关。考虑下面的数字:

蓝色分布和红色分布是正态数据,但在不同的设置下,在训练时间内,我们只有一个设置。此数据针对一个传感器。因此,假设我们训练了一个蓝色的模型,并且有一些异常样本。将异常样本想象为测量中有一点噪声或故障的正常样本。然后,我们想测试模型,但设置改变,现在我们有红色分布作为我们的测试观察。因此,该模型对样本进行了错误分类

对于这种情况,最好的方法是什么?请注意,我尝试过几种聚类算法,但它们无法管理和区分正常和异常样本


欢迎任何建议和帮助。谢谢

有很多关于时间序列数据的书

特别是在更改检测上。你的例子可以被认为是均值的变化。有一些统计模型可以检测到这一点

巴塞维尔、米切尔和伊戈尔·尼基福罗夫。突变检测:理论与应用。第104卷。恩格尔伍德悬崖:普伦蒂斯大厅,1993年


谢谢你的回答。你知道这方面有什么有用的学术论文或白皮书吗?或者你能说出一些型号吗?实际上,我不想只检测变化点。我希望能够在改变点之后区分正常样本和异常样本。谢谢,是的。我看到了。我应该读整本书吗?你推荐哪一部分?我想也许有一篇论文是对那本书的总结。谢谢。我不知道哪些部分对你最相关。我想整本书都是相关的,你必须自己决定尝试哪种方法。这也是寻找其他文献的良好起点。