Machine learning 使用StandartScaler处理的数据帧是否可以包含值>;1或<-1.

Machine learning 使用StandartScaler处理的数据帧是否可以包含值>;1或<-1.,machine-learning,scikit-learn,standard-deviation,Machine Learning,Scikit Learn,Standard Deviation,我按如下方式缩放功能数据框: flatted_num_f.head() num\u features\u test=flatted\u num\u f.fillna(flatted\u num\u f.mean()) 从sklearn.preprocessing导入StandardScaler std_scaler=StandardScaler() num_train_std=pd.DataFrame(std_scaler.fit_transform(num_features_test.loc[

我按如下方式缩放功能数据框:

flatted_num_f.head()
num\u features\u test=flatted\u num\u f.fillna(flatted\u num\u f.mean())
从sklearn.preprocessing导入StandardScaler
std_scaler=StandardScaler()
num_train_std=pd.DataFrame(std_scaler.fit_transform(num_features_test.loc[y_train_id])\
columns=num\u features\u test.loc[y\u train\u id]。columns\
index=num\u features\u test.loc[y\u train\u id]。index)
测试标准(列车数量标准)
最后一个函数将超出[-1,1]约束的值添加到列表中, 它发现约100个元素,最大值为78.86000099160675,最小值为:-2.7850507071746339


这是正态分布,还是我弄错了?

StandardScaler根据标准正态分布(其平均值为零,标准偏差为1)进行转换。在这个分布中,随机变量可以取-无穷大和无穷大之间的任何值。较大的值不太可能出现,但可能会出现。事实上,你能看到小于-1或大于1的值的概率约为32%

有关图像的来源和一些示例计算,请参见


在标准最小-最大归一化中,减去最小值并除以范围,得到的值介于0和1之间,但可以使用线性函数进行修改,以便得到介于-1和1之间的值。

StandardScaler根据标准正态分布(其平均值为零,标准偏差为1)进行转换。在这个分布中,随机变量可以取-无穷大和无穷大之间的任何值。较大的值不太可能出现,但可能会出现。事实上,你能看到小于-1或大于1的值的概率约为32%

有关图像的来源和一些示例计算,请参见

在标准的“最小值-最大值”(min-max normalization)标准化中,减去最小值并除以范围,得到的值介于0和1之间,但可以使用线性函数对其进行修改,以便得到介于-1和1之间的值