Machine learning 异常检测-使用什么_Machine Learning_Data Mining_Outliers

Machine learning 异常检测-使用什么

machine-learning

Machine learning 异常检测-使用什么,machine-learning,data-mining,outliers,Machine Learning,Data Mining,Outliers,使用什么系统进行异常检测我看到像Mahout这样的系统并没有列出异常检测，但是分类、聚类、推荐等问题任何建议以及教程和代码示例都非常好，因为我以前没有做过。有一个异常检测，它基于一类SVM。您还可以查看已实现空间离群点检测的除了“异常检测”，您还可以使用“异常检测”、“欺诈检测”、“入侵检测”来扩展搜索范围，以获得更多结果。有一种基于一类SVM的异常检测。您还可以查看已实现空间离群点检测的除了“异常检测”，您还可以使用“异常检测”、“欺诈检测”、“入侵检测”扩展搜索范围，以获得更多结果。

使用什么系统进行异常检测

我看到像Mahout这样的系统并没有列出异常检测，但是分类、聚类、推荐等问题

任何建议以及教程和代码示例都非常好，因为我以前没有做过。

有一个异常检测，它基于一类SVM。您还可以查看已实现空间离群点检测的

除了“异常检测”，您还可以使用“异常检测”、“欺诈检测”、“入侵检测”来扩展搜索范围，以获得更多结果。

有一种基于一类SVM的异常检测。您还可以查看已实现空间离群点检测的

除了“异常检测”，您还可以使用“异常检测”、“欺诈检测”、“入侵检测”扩展搜索范围，以获得更多结果。

有三类异常检测方法，即有监督、半监督和无监督

监督：需要完全标记的培训和测试数据集。首先训练一个普通的分类器，然后应用它
半监督：使用训练和测试数据集，而训练数据仅由正常数据组成，没有任何异常值。学习正常类的模型，然后通过偏离该模型来检测异常值
无监督：不需要任何标签；训练数据集和测试数据集之间没有区别。数据集的评分仅基于数据集的内在属性

如果您有未标记的数据，则可以使用以下无监督异常检测方法来检测异常数据：

使用自动编码器，捕获数据中存在的特征的特征表示，并将其标记为异常值数据点，这些数据点未使用新表示进行很好的解释。数据点的离群值分数是基于重建误差（即原始数据与其投影之间的平方距离）计算的，您可以在和中找到实现

使用聚类方法，例如自组织映射（SOM）和k-Prototype将未标记的数据聚类到多个组中。您可以检测数据中的外部和内部异常值。外部异常值定义为位于最小聚类的记录。内部异常值定义为位于集群内部较远位置的记录。您可以找到和的代码

如果您已经标记了数据，那么有很多监督分类方法可以尝试检测异常值。例如神经网络、决策树和支持向量机
离群点检测方法有三类，即有监督、半监督和无监督

监督：需要完全标记的培训和测试数据集。首先训练一个普通的分类器，然后应用它

半监督：使用训练和测试数据集，而训练数据仅由正常数据组成，没有任何异常值。学习正常类的模型，然后通过偏离该模型来检测异常值

无监督：不需要任何标签；训练数据集和测试数据集之间没有区别。数据集的评分仅基于数据集的内在属性

如果您有未标记的数据，则可以使用以下无监督异常检测方法来检测异常数据：

如果您已经标记了数据，那么有很多监督分类方法可以尝试检测异常值。例如神经网络、决策树和支持向量机