Machine learning 使用标准化或规范化'；s培训/验证/测试中的参数_Machine Learning_Normalization_Data Processing

Machine learning 使用标准化或规范化'；s培训/验证/测试中的参数

machine-learning

Machine learning 使用标准化或规范化'；s培训/验证/测试中的参数,machine-learning,normalization,data-processing,Machine Learning,Normalization,Data Processing,最佳做法是规范化/标准化训练集，然后使用其参数（min&max进行规范化和mean&std进行标准化）规范化/标准化验证集我想知道的是，在验证中设置不同的最小/最大值会产生什么影响，因此最终得到的值的范围不再在区间（0,1）内这如何影响神经网络的训练最后一个疑问：当我们使用测试集在看不见的数据上评估模型的性能时，我们是否应该再次使用训练参数规范化/标准化数据？由于这些参数实际上与经过训练的模型联系在一起。缩放时，您通常知道数据的范围：对于图像，从0-255到0-1，这很好，您事先知道范

最佳做法是规范化/标准化训练集，然后使用其参数（

min

max

进行规范化和

mean

std

进行标准化）规范化/标准化验证集

我想知道的是，在验证中设置不同的最小/最大值会产生什么影响，因此最终得到的值的范围不再在区间（0,1）内

这如何影响神经网络的训练

最后一个疑问：当我们使用测试集在看不见的数据上评估模型的性能时，我们是否应该再次使用训练参数规范化/标准化数据？由于这些参数实际上与经过训练的模型联系在一起。

缩放时，您通常知道数据的范围：

对于图像，从0-255到0-1，这很好，您事先知道范围
对于其他特征，缩放的不是均匀分布，而是高斯分布，在这种情况下，输出（或[-1,1]）不得受[0,1]间隔的约束

所以通常，如果你知道你想要什么样的输出（概率或图像），你也知道你能为输入得到的真实完整范围

当您不知道输入范围时，您通常不希望在输出处有一个sigmoid，因为这对网络的约束比您应该的要大

是的，您需要使用与训练数据相同的预处理管道，这意味着经过训练的规范化参数。

好的，谢谢。我没有在输出端使用sigmoid。我正在研制一种利用多功能传感器数据的自动编码器，我无法预先预测和给出范围。谢谢你的回答，所以我不应该受[0,1][1,1]间隔的限制。事实上，如果你没有[-1,1]，那就太好了。如果除以数据的标准偏差，就不会得到它。