Machine learning 使用scikit学习识别异常负载配置文件

Machine learning 使用scikit学习识别异常负载配置文件,machine-learning,scikit-learn,Machine Learning,Scikit Learn,我正在寻找如何使用scikit学习帮助我解决业务问题 我在一家电力公司工作,我们必须找出变电站的峰值负荷。然而,我们只对网络处于正常状态时的峰值负载感兴趣。目前,我们通过绘制x=日期、y=一天中的时间、z=荷载的三维曲面图并手动检查荷载形状来实现这一点。尖峰负载-或阶跃变化后出现的峰值负载是由网络中的切换而不是客户需求引起的-我们必须忽略这些虚假的峰值负载。附件中的图表给出了一个例子——正如您所看到的——它通常是相当明显的。 我已经开始使用scikit learn kaggle-titanic

我正在寻找如何使用scikit学习帮助我解决业务问题

我在一家电力公司工作,我们必须找出变电站的峰值负荷。然而,我们只对网络处于正常状态时的峰值负载感兴趣。目前,我们通过绘制x=日期、y=一天中的时间、z=荷载的三维曲面图并手动检查荷载形状来实现这一点。尖峰负载-或阶跃变化后出现的峰值负载是由网络中的切换而不是客户需求引起的-我们必须忽略这些虚假的峰值负载。附件中的图表给出了一个例子——正如您所看到的——它通常是相当明显的。

我已经开始使用scikit learn kaggle-titanic等-我觉得应该可以使用机器学习过滤掉这些虚假的峰值负载-但我不知道从哪里开始,也不知道哪种算法最适合这个问题

数据相当简单

    Date         0:00           0:15           0:30 ...etc etc
6/08/2013        54.4273        57.0923        53.7607... 
7/08/2013        54.413         52.7667        51.24... 
8/08/2013        51.3207        53.264         53.2603... 
9/08/2013        57.8673        59.5287        55.921... 
10/08/2013       62.92          61.4653        60.2743... 
11/08/2013       55.1523        55.8627        52.219... 

感激地收到的任何指针或示例

您可以获取负载随时间变化的一阶导数,然后将其转换为二进制分类任务,并使用任何监督学习算法。我认为您应该问这个问题。请看这里,可能对您有用: