Machine learning 归一化会降低分类器的性能_Machine Learning_Classification_Random Forest

Machine learning 归一化会降低分类器的性能

machine-learning

Machine learning 归一化会降低分类器的性能,machine-learning,classification,random-forest,Machine Learning,Classification,Random Forest,我正在用我收集的一些数据研究随机森林。我测试了我的分类器，在测试集上获得了大约89%的准确率。然而，当我将数据缩放到零均值和单位方差时，我的准确率下降了近50%。我看到一篇帖子，它似乎暗示我不需要扩展数据来获得最佳性能有谁能解释一下准确率如此显著下降的可能原因编辑：我正在使用sklearn.ensemble进行随机林实现下面是一个关于数据的例子关于输入特征的某些变换，您的随机林是否不变完全取决于您的错误函数。简而言之，当你的函数在平移和缩放下是不变的，你的模型也是不变的在快速浏览帮助页面

我正在用我收集的一些数据研究随机森林。我测试了我的分类器，在测试集上获得了大约89%的准确率。然而，当我将数据缩放到零均值和单位方差时，我的准确率下降了近50%。我看到一篇帖子，它似乎暗示我不需要扩展数据来获得最佳性能

有谁能解释一下准确率如此显著下降的可能原因

编辑：我正在使用sklearn.ensemble进行随机林实现

下面是一个关于数据的例子

关于输入特征的某些变换，您的随机林是否不变完全取决于您的错误函数。简而言之，当你的函数在平移和缩放下是不变的，你的模型也是不变的

在快速浏览帮助页面后，使用的标准功能似乎是异常丢失。此函数在输入特征的缩放下不是不变的，这解释了您的观察。

这是数据相关的。你能在某个地方分享你的数据吗？@greeness我上传了我的数据文件，我感觉它与数据有关。我还尝试了支持向量机，奇怪的是，支持向量机在无标度数据的情况下提供了更好的分类。