Data mining 如何从大量数据中识别异常数据?

Data mining 如何从大量数据中识别异常数据?,data-mining,Data Mining,我想问一下从大量数据中识别异常数据的理论或其他问题 For example: Sequence data :2,2,2,3,3,3,3,5,2,2,2,3,3,7,7,3,2,... Abnormal data :5,7 对均值和标准差进行稳健的估计 例如,中位数和疯狂 然后定义一个阈值,例如中值+2*MAD

我想问一下从大量数据中识别异常数据的理论或其他问题

For example:
Sequence data :2,2,2,3,3,3,3,5,2,2,2,3,3,7,7,3,2,...
Abnormal data :5,7

对均值和标准差进行稳健的估计

例如,中位数和疯狂

然后定义一个阈值,例如中值+2*MAD