Matlab 基于高斯混合模型的离群点检测

Matlab 基于高斯混合模型的离群点检测,matlab,statistics,probability,gaussian,probability-theory,Matlab,Statistics,Probability,Gaussian,Probability Theory,我有一套数据。我想从这些数据构建一个单类分布。基于学习到的分布,我想得到每个数据实例的概率值。 基于这个概率值(阈值),我想构建一个分类器来分类特定数据实例是否来自该分布 在本例中,假设我有一个50x100000的数据,其中50是每个数据实例的维度,实例数是100000。我正在学习一个基于这个分布的高斯混合模型 当我尝试获得实例的概率值时,我得到的值非常低。那么在这种情况下,如何构建一个clssifier呢?我认为这没有意义。例如,假设您的数据是一维的,并且假设事实是它是从一个样本中采样的。但是

我有一套数据。我想从这些数据构建一个单类分布。基于学习到的分布,我想得到每个数据实例的概率值。 基于这个概率值(阈值),我想构建一个分类器来分类特定数据实例是否来自该分布

在本例中,假设我有一个50x100000的数据,其中50是每个数据实例的维度,实例数是100000。我正在学习一个基于这个分布的高斯混合模型


当我尝试获得实例的概率值时,我得到的值非常低。那么在这种情况下,如何构建一个clssifier呢?

我认为这没有意义。例如,假设您的数据是一维的,并且假设事实是它是从一个样本中采样的。但是假设你还没有计算出它来自于双峰分布,你符合正态分布。你仍然有可能得到最佳拟合,但这可能是对错误分布的最佳拟合,事实是,没有一个点来自该分布或任何类似的分布。

如果你只有“一个类”,为什么要使用混合模型=混合物中的一个成分?如果我应用两次高斯函数来检测和排除数据集中每个参数的正数和负数上的异常值,事实上,我使用了双峰高斯分布?