Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/299.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/16.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/heroku/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 是否有必要在y_列车和y_测试中使用StandardScaler?若有,个案数目为何?_Python_Python 3.x_Pandas_Scikit Learn_Data Science - Fatal编程技术网

Python 是否有必要在y_列车和y_测试中使用StandardScaler?若有,个案数目为何?

Python 是否有必要在y_列车和y_测试中使用StandardScaler?若有,个案数目为何?,python,python-3.x,pandas,scikit-learn,data-science,Python,Python 3.x,Pandas,Scikit Learn,Data Science,阅读过多次在y_列车和y_测试中使用StandardScaler的案例,以及未使用StandardScaler的案例。在他们身上应该使用哪些特定规则?引用: 数据集的标准化是许多机器的共同要求 学习估计员:如果个体 功能或多或少不像标准的正态分布 数据(例如均值和单位方差为0的高斯分布) 例如,目标函数中使用了许多元素 学习算法(如支持向量机的RBF核) 或者线性模型的L1和L2正则化子)假设 特征以0为中心,且变化顺序相同。如果 特征的方差比特征的方差大几个数量级 另外,它可能会支配目标函数并

阅读过多次在y_列车和y_测试中使用StandardScaler的案例,以及未使用StandardScaler的案例。在他们身上应该使用哪些特定规则?

引用:

数据集的标准化是许多机器的共同要求 学习估计员:如果个体 功能或多或少不像标准的正态分布 数据(例如均值和单位方差为0的高斯分布)

例如,目标函数中使用了许多元素 学习算法(如支持向量机的RBF核) 或者线性模型的L1和L2正则化子)假设 特征以0为中心,且变化顺序相同。如果 特征的方差比特征的方差大几个数量级 另外,它可能会支配目标函数并使 估计器无法按照预期正确地从其他特征中学习


因此,当您的功能具有不同的比例/分布时,您可能应该标准化/缩放它们的值。

当您的功能具有不同的比例时,您应该标准化它们的值。这对于或堆栈站点来说是一个更好的问题,因为它与理论有关,而不是与特定的编码问题有关