Python 线性回归标度特征
我想做一个线性回归 我的特征如下:Python 线性回归标度特征,python,linear-regression,scaling,feature-scaling,Python,Linear Regression,Scaling,Feature Scaling,我想做一个线性回归 我的特征如下: Marketcap EBIT Margin Price to Book Ratio EPS Growth 5.589918e+08 23.05 8.71 7.16 5.572475e+08 65.00 9.68 - 18.44 8.639290e+09 7.8 12.74
Marketcap EBIT Margin Price to Book Ratio EPS Growth
5.589918e+08 23.05 8.71 7.16
5.572475e+08 65.00 9.68 - 18.44
8.639290e+09 7.8 12.74 - 55.00
在进行线性回归时,我确实需要调整这些功能,尤其是当它们有着如此不同的规模,比如Marketcap和其他功能时,对吗
每股收益增长的负值是什么?
在本例中,执行特征缩放的最佳方法是什么?来自:
通过删除平均值并缩放到单位方差来标准化特征
这意味着,给定一个输入x,将其转换为(x-mean)/std(其中所有尺寸和操作都定义得很好)
因此,即使您的输入值都为正值,删除平均值也会使其中一些值为负值:
>>> x = np.array([3,5,7])
>>> np.mean(x)
5.0
>>> x - np.mean(x)
array([-2., 0., 2.])
更多详情:
(第4.3节)
您是否尝试过一些标准的缩放方式?例如:我尝试了
预处理。StandardScaler
但是当我尝试拟合线性回归时,我得到了一个错误:ValueError:预期的2D数组,得到的是标量数组:如果不查看实现,很难猜出哪里出了错。你能把你的代码和一些样本数据和你的问题一起发布吗?这很有效,我用了预处理。scale
。