Python sklearn normalize()将每个值生成为1
我试图将单个特性规范化为[0,1],但我得到的结果是所有浮点值都是1,这显然是错误的Python sklearn normalize()将每个值生成为1,python,pandas,scikit-learn,normalization,Python,Pandas,Scikit Learn,Normalization,我试图将单个特性规范化为[0,1],但我得到的结果是所有浮点值都是1,这显然是错误的 import pandas as pd import numpy as np from sklearn.preprocessing import normalize test = pd.DataFrame(data=[7, 6, 5, 2, 9, 9, 7, 8, 6, 5], columns=['data']) normalize(test['data'].values.reshape(-1, 1)) 这
import pandas as pd
import numpy as np
from sklearn.preprocessing import normalize
test = pd.DataFrame(data=[7, 6, 5, 2, 9, 9, 7, 8, 6, 5], columns=['data'])
normalize(test['data'].values.reshape(-1, 1))
这将产生以下输出:
array([[1.],
[1.],
[1.],
[1.],
[1.],
[1.],
[1.],
[1.],
[1.],
[1.]])
我认为这可能是一个int-to-float数据类型的问题,所以我尝试先转换为float,
normalize(test['data'].astype(float).values.reformate(-1,1))
,但这给出了相同的结果。我缺少什么?这是因为默认的轴是1
设置轴=0
:
normalize(test['data'].values.reshape(-1, 1), axis=0)
输出:
array([[0.32998316],
[0.28284271],
[0.23570226],
[0.0942809 ],
[0.42426407],
[0.42426407],
[0.32998316],
[0.37712362],
[0.28284271],
[0.23570226]])
我觉得我们可以用
(test.data-test.data.min())/np.ptp(test.data.values)
Out[136]:
0 0.714286
1 0.571429
2 0.428571
3 0.000000
4 1.000000
5 1.000000
6 0.714286
7 0.857143
8 0.571429
9 0.428571
Name: data, dtype: float64
非常奇怪-通常axis=1
对应一列(在我心目中是一个特性),所以我认为默认值是可以的。我想当我使用restrape
来满足sklearn
的2D数组要求时,它现在被看作是一个“行”样本,而不是一个列/特征。@JulianDrago,因为默认情况下它是l2
标准。尝试norm='max'
:)从数字上看,这看起来是正确的,所以+1,尽管我对基于sklearn
的解决方案感兴趣。