Machine learning 归一化会降低分类器的性能

Machine learning 归一化会降低分类器的性能,machine-learning,classification,random-forest,Machine Learning,Classification,Random Forest,我正在用我收集的一些数据研究随机森林。我测试了我的分类器,在测试集上获得了大约89%的准确率。然而,当我将数据缩放到零均值和单位方差时,我的准确率下降了近50%。我看到一篇帖子,它似乎暗示我不需要扩展数据来获得最佳性能 有谁能解释一下准确率如此显著下降的可能原因 编辑:我正在使用sklearn.ensemble进行随机林实现 下面是一个关于数据的例子关于输入特征的某些变换,您的随机林是否不变完全取决于您的错误函数。简而言之,当你的函数在平移和缩放下是不变的,你的模型也是不变的 在快速浏览帮助页面

我正在用我收集的一些数据研究随机森林。我测试了我的分类器,在测试集上获得了大约89%的准确率。然而,当我将数据缩放到零均值和单位方差时,我的准确率下降了近50%。我看到一篇帖子,它似乎暗示我不需要扩展数据来获得最佳性能

有谁能解释一下准确率如此显著下降的可能原因

编辑:我正在使用sklearn.ensemble进行随机林实现


下面是一个关于数据的例子

关于输入特征的某些变换,您的随机林是否不变完全取决于您的错误函数。简而言之,当你的函数在平移和缩放下是不变的,你的模型也是不变的


在快速浏览帮助页面后,使用的标准功能似乎是异常丢失。此函数在输入特征的缩放下不是不变的,这解释了您的观察。

这是数据相关的。你能在某个地方分享你的数据吗?@greeness我上传了我的数据文件,我感觉它与数据有关。我还尝试了支持向量机,奇怪的是,支持向量机在无标度数据的情况下提供了更好的分类。