Machine learning 数据复杂性度量

Machine learning 数据复杂性度量,machine-learning,statistics,dataset,classification,Machine Learning,Statistics,Dataset,Classification,当我们努力解释机器学习算法的准确性时,许多作者建议从数据的复杂程度开始 我正在研究数据复杂性度量,例如:类可分性、重叠和离群值度量,它们会影响分类器的性能 例如,若类是更可分离的,那个么分类器的精度也会提高,并且分类器花费的时间更少 我想计算数据集中每个数据点的离群值度量,并将这些度量结合起来,为数据集中的离群值创建一个度量。如何使用k近邻或k均值聚类技术计算离群值。 Thanx提前..使用什么语言和框架?我想这个问题属于我们,我们有一个不同类别的数据集,比如:医疗、软件工程、机械数据集等等。语

当我们努力解释机器学习算法的准确性时,许多作者建议从数据的复杂程度开始

我正在研究数据复杂性度量,例如:类可分性、重叠和离群值度量,它们会影响分类器的性能

例如,若类是更可分离的,那个么分类器的精度也会提高,并且分类器花费的时间更少

我想计算数据集中每个数据点的离群值度量,并将这些度量结合起来,为数据集中的离群值创建一个度量。如何使用k近邻或k均值聚类技术计算离群值。
Thanx提前..

使用什么语言和框架?我想这个问题属于我们,我们有一个不同类别的数据集,比如:医疗、软件工程、机械数据集等等。语言不是一个简单的问题,但你打算如何解析数据集并处理它们?你会使用MATLAB或类似的科学程序提供很多计算逻辑吗?如果语言不是一个条形,你问的是?是的,我正在请求算法寻找异常值。如果是首选的,那么C++