Machine learning 使用scikit学习识别异常负载配置文件
我正在寻找如何使用scikit学习帮助我解决业务问题 我在一家电力公司工作,我们必须找出变电站的峰值负荷。然而,我们只对网络处于正常状态时的峰值负载感兴趣。目前,我们通过绘制x=日期、y=一天中的时间、z=荷载的三维曲面图并手动检查荷载形状来实现这一点。尖峰负载-或阶跃变化后出现的峰值负载是由网络中的切换而不是客户需求引起的-我们必须忽略这些虚假的峰值负载。附件中的图表给出了一个例子——正如您所看到的——它通常是相当明显的。 我已经开始使用scikit learn kaggle-titanic等-我觉得应该可以使用机器学习过滤掉这些虚假的峰值负载-但我不知道从哪里开始,也不知道哪种算法最适合这个问题 数据相当简单Machine learning 使用scikit学习识别异常负载配置文件,machine-learning,scikit-learn,Machine Learning,Scikit Learn,我正在寻找如何使用scikit学习帮助我解决业务问题 我在一家电力公司工作,我们必须找出变电站的峰值负荷。然而,我们只对网络处于正常状态时的峰值负载感兴趣。目前,我们通过绘制x=日期、y=一天中的时间、z=荷载的三维曲面图并手动检查荷载形状来实现这一点。尖峰负载-或阶跃变化后出现的峰值负载是由网络中的切换而不是客户需求引起的-我们必须忽略这些虚假的峰值负载。附件中的图表给出了一个例子——正如您所看到的——它通常是相当明显的。 我已经开始使用scikit learn kaggle-titanic
Date 0:00 0:15 0:30 ...etc etc
6/08/2013 54.4273 57.0923 53.7607...
7/08/2013 54.413 52.7667 51.24...
8/08/2013 51.3207 53.264 53.2603...
9/08/2013 57.8673 59.5287 55.921...
10/08/2013 62.92 61.4653 60.2743...
11/08/2013 55.1523 55.8627 52.219...
感激地收到的任何指针或示例您可以获取负载随时间变化的一阶导数,然后将其转换为二进制分类任务,并使用任何监督学习算法。我认为您应该问这个问题。请看这里,可能对您有用: