Machine learning 标准化X_列车和Y_列车

Machine learning 标准化X_列车和Y_列车,machine-learning,standardization,Machine Learning,Standardization,我是这个领域的新手,目前正在开发一个基于Facebook广告的数据集 目标变量是10到200之间的花费量,特征是频率(范围在0.1到3.0之间)和印象(1000到30000) 在训练我的模型(线性回归)后,我的得分是0.84,但的MSE是490,我认为这个值是因为特征有这样的行:(频率:1.432,印象:25412) 我在列车和测试数据中分割数据后应用了标准化 **为了解决这个问题,我想应用标准化来消除我应用的fit_变换(X_train)和变换(X_test)值的高方差 但是得分与相同,MS

我是这个领域的新手,目前正在开发一个基于Facebook广告的数据集

目标变量是10到200之间的花费量,特征是频率(范围在0.1到3.0之间)和印象(1000到30000)

在训练我的模型(线性回归)后,我的得分是0.84,但的MSE是490,我认为这个值是因为特征有这样的行:(频率:1.432,印象:25412)

我在列车和测试数据中分割数据后应用了标准化

**为了解决这个问题,我想应用标准化来消除我应用的fit_变换(X_train)和变换(X_test)值的高方差

但是得分与相同,MSE也一样。

我的怀疑是相当愚蠢的,但我在这个领域的工作就像ML上的新手一样

1)我注意到社区没有对目标变量(Y)应用标准化他们为什么这样做

2)我在这里做错什么了吗


谢谢你们

标准化通常应用于自变量,因此均值约为零,标准差为一。即数据转换为标准正态分布。这是因为它将自变量形式的比例标准化为0到1。例如,如果variable1在os 100到100的范围内,variable2在0到1的范围内,并且如果沿着x轴将它们一起绘制,您会看到图形中的vaibale2接近于零,任何变量2的任何更改都可能不会影响目标值

目标不应该标准化,因为如果模型应该预测的话会怎样。y=f(x),y为目标值