Machine learning 异常检测-使用什么

Machine learning 异常检测-使用什么,machine-learning,data-mining,outliers,Machine Learning,Data Mining,Outliers,使用什么系统进行异常检测 我看到像Mahout这样的系统并没有列出异常检测,但是分类、聚类、推荐等问题 任何建议以及教程和代码示例都非常好,因为我以前没有做过。有一个异常检测,它基于一类SVM。您还可以查看已实现空间离群点检测的 除了“异常检测”,您还可以使用“异常检测”、“欺诈检测”、“入侵检测”来扩展搜索范围,以获得更多结果。有一种基于一类SVM的异常检测。您还可以查看已实现空间离群点检测的 除了“异常检测”,您还可以使用“异常检测”、“欺诈检测”、“入侵检测”扩展搜索范围,以获得更多结果。

使用什么系统进行异常检测

我看到像Mahout这样的系统并没有列出异常检测,但是分类、聚类、推荐等问题


任何建议以及教程和代码示例都非常好,因为我以前没有做过。

有一个异常检测,它基于一类SVM。您还可以查看已实现空间离群点检测的


除了“异常检测”,您还可以使用“异常检测”、“欺诈检测”、“入侵检测”来扩展搜索范围,以获得更多结果。

有一种基于一类SVM的异常检测。您还可以查看已实现空间离群点检测的


除了“异常检测”,您还可以使用“异常检测”、“欺诈检测”、“入侵检测”扩展搜索范围,以获得更多结果。

有三类异常检测方法,即有监督、半监督和无监督

  • 监督:需要完全标记的培训和测试数据集。首先训练一个普通的分类器,然后应用它
  • 半监督:使用训练和测试数据集,而训练数据仅由正常数据组成,没有任何异常值。学习正常类的模型,然后通过偏离该模型来检测异常值
  • 无监督:不需要任何标签;训练数据集和测试数据集之间没有区别。数据集的评分仅基于数据集的内在属性
如果您有未标记的数据,则可以使用以下无监督异常检测方法来检测异常数据:

  • 使用自动编码器,捕获数据中存在的特征的特征表示,并将其标记为异常值数据点,这些数据点未使用新表示进行很好的解释。数据点的离群值分数是基于重建误差(即原始数据与其投影之间的平方距离)计算的,您可以在和中找到实现
  • 使用聚类方法,例如自组织映射(SOM)k-Prototype将未标记的数据聚类到多个组中。您可以检测数据中的外部和内部异常值。外部异常值定义为位于最小聚类的记录。内部异常值定义为位于集群内部较远位置的记录。您可以找到和的代码

  • 如果您已经标记了数据,那么有很多监督分类方法可以尝试检测异常值。例如神经网络决策树支持向量机

    离群点检测方法有三类,即有监督、半监督和无监督

    • 监督:需要完全标记的培训和测试数据集。首先训练一个普通的分类器,然后应用它
    • 半监督:使用训练和测试数据集,而训练数据仅由正常数据组成,没有任何异常值。学习正常类的模型,然后通过偏离该模型来检测异常值
    • 无监督:不需要任何标签;训练数据集和测试数据集之间没有区别。数据集的评分仅基于数据集的内在属性
    如果您有未标记的数据,则可以使用以下无监督异常检测方法来检测异常数据:

  • 使用自动编码器,捕获数据中存在的特征的特征表示,并将其标记为异常值数据点,这些数据点未使用新表示进行很好的解释。数据点的离群值分数是基于重建误差(即原始数据与其投影之间的平方距离)计算的,您可以在和中找到实现
  • 使用聚类方法,例如自组织映射(SOM)k-Prototype将未标记的数据聚类到多个组中。您可以检测数据中的外部和内部异常值。外部异常值定义为位于最小聚类的记录。内部异常值定义为位于集群内部较远位置的记录。您可以找到和的代码
  • 如果您已经标记了数据,那么有很多监督分类方法可以尝试检测异常值。例如神经网络决策树支持向量机