Python 是否有必要在y_列车和y_测试中使用StandardScaler？若有，个案数目为何？_Python_Python 3.x_Pandas_Scikit Learn_Data Science

Python 是否有必要在y_列车和y_测试中使用StandardScaler？若有，个案数目为何？

python python-3.x pandas scikit-learn

Python 是否有必要在y_列车和y_测试中使用StandardScaler？若有，个案数目为何？,python,python-3.x,pandas,scikit-learn,data-science,Python,Python 3.x,Pandas,Scikit Learn,Data Science,阅读过多次在y_列车和y_测试中使用StandardScaler的案例，以及未使用StandardScaler的案例。在他们身上应该使用哪些特定规则？引用：数据集的标准化是许多机器的共同要求学习估计员：如果个体功能或多或少不像标准的正态分布数据（例如均值和单位方差为0的高斯分布）例如，目标函数中使用了许多元素学习算法（如支持向量机的RBF核）或者线性模型的L1和L2正则化子）假设特征以0为中心，且变化顺序相同。如果特征的方差比特征的方差大几个数量级另外，它可能会支配目标函数并

阅读过多次在y_列车和y_测试中使用StandardScaler的案例，以及未使用StandardScaler的案例。在他们身上应该使用哪些特定规则？

引用：

数据集的标准化是许多机器的共同要求学习估计员：如果个体功能或多或少不像标准的正态分布数据（例如均值和单位方差为0的高斯分布）

例如，目标函数中使用了许多元素学习算法（如支持向量机的RBF核）或者线性模型的L1和L2正则化子）假设特征以0为中心，且变化顺序相同。如果特征的方差比特征的方差大几个数量级另外，它可能会支配目标函数并使估计器无法按照预期正确地从其他特征中学习

因此，当您的功能具有不同的比例/分布时，您可能应该标准化/缩放它们的值。

当您的功能具有不同的比例时，您应该标准化它们的值。这对于或堆栈站点来说是一个更好的问题，因为它与理论有关，而不是与特定的编码问题有关