Algorithm 异常检测算法
我的任务是使用机器学习算法从各种格式的数据中检测异常(已知或未知),例如电子邮件、IMs等Algorithm 异常检测算法,algorithm,filter,filtering,heuristics,Algorithm,Filter,Filtering,Heuristics,我的任务是使用机器学习算法从各种格式的数据中检测异常(已知或未知),例如电子邮件、IMs等 您最喜欢和最有效的异常检测算法是什么 它们的局限性和优点是什么 您建议如何解决这些限制 非常感谢您的所有建议。一些垃圾邮件过滤器使用的统计过滤器或某些劣质版本很容易实现。另外还有很多关于它的在线文档 最大的缺点是它无法真正检测未知的事物。您可以使用大量已知数据样本对其进行训练,以便它可以对新传入的数据进行分类。但是你可以把传统的垃圾邮件过滤器颠倒过来:训练它识别合法数据而不是非法数据,这样它不识别的任何东
最大的缺点是它无法真正检测未知的事物。您可以使用大量已知数据样本对其进行训练,以便它可以对新传入的数据进行分类。但是你可以把传统的垃圾邮件过滤器颠倒过来:训练它识别合法数据而不是非法数据,这样它不识别的任何东西都是异常现象。根据数据类型和你试图解决的问题,有各种类型的异常检测算法:
(免责声明:我是Anodot的首席数据科学家,Anodot是一家对时间序列数据进行实时异常检测的商业公司)。谢谢,贝叶斯垃圾邮件过滤器似乎是一种不错的方法。我想知道您是否尝试过卡尔曼滤波、支持向量机或其他方法。我不完全确定如何将卡尔曼滤波应用于文本处理。可能是逐字节的,但这太细粒度了,无法有效地对单词和/或短语进行统计分析。@slebetman在实时事务系统中,哪种算法或技术工作良好或至少令人满意?我们需要处理具有许多参数的输入记录,并在处理自身时检测异常,以便系统不会挂起或减慢。