Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/276.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 线性回归标度特征_Python_Linear Regression_Scaling_Feature Scaling - Fatal编程技术网

Python 线性回归标度特征

Python 线性回归标度特征,python,linear-regression,scaling,feature-scaling,Python,Linear Regression,Scaling,Feature Scaling,我想做一个线性回归 我的特征如下: Marketcap EBIT Margin Price to Book Ratio EPS Growth 5.589918e+08 23.05 8.71 7.16 5.572475e+08 65.00 9.68 - 18.44 8.639290e+09 7.8 12.74

我想做一个线性回归

我的特征如下:

Marketcap       EBIT Margin   Price to Book Ratio   EPS Growth

5.589918e+08    23.05            8.71                 7.16
5.572475e+08    65.00            9.68              - 18.44
8.639290e+09     7.8            12.74              - 55.00
在进行线性回归时,我确实需要调整这些功能,尤其是当它们有着如此不同的规模,比如Marketcap和其他功能时,对吗

每股收益增长的负值是什么? 在本例中,执行特征缩放的最佳方法是什么?

来自:

通过删除平均值并缩放到单位方差来标准化特征

这意味着,给定一个输入x,将其转换为(x-mean)/std(其中所有尺寸和操作都定义得很好)

因此,即使您的输入值都为正值,删除平均值也会使其中一些值为负值:

>>> x = np.array([3,5,7])
>>> np.mean(x)
5.0
>>> x - np.mean(x)
array([-2.,  0.,  2.])
更多详情:

(第4.3节)

您是否尝试过一些标准的缩放方式?例如:我尝试了
预处理。StandardScaler
但是当我尝试拟合线性回归时,我得到了一个错误:ValueError:预期的2D数组,得到的是标量数组:如果不查看实现,很难猜出哪里出了错。你能把你的代码和一些样本数据和你的问题一起发布吗?这很有效,我用了
预处理。scale