Machine learning 使用标准化或规范化';s培训/验证/测试中的参数

Machine learning 使用标准化或规范化';s培训/验证/测试中的参数,machine-learning,normalization,data-processing,Machine Learning,Normalization,Data Processing,最佳做法是规范化/标准化训练集,然后使用其参数(min&max进行规范化和mean&std进行标准化)规范化/标准化验证集 我想知道的是,在验证中设置不同的最小/最大值会产生什么影响,因此最终得到的值的范围不再在区间(0,1)内 这如何影响神经网络的训练 最后一个疑问:当我们使用测试集在看不见的数据上评估模型的性能时,我们是否应该再次使用训练参数规范化/标准化数据?由于这些参数实际上与经过训练的模型联系在一起。缩放时,您通常知道数据的范围: 对于图像,从0-255到0-1,这很好,您事先知道范

最佳做法是规范化/标准化训练集,然后使用其参数(
min
&
max
进行规范化和
mean
&
std
进行标准化)规范化/标准化验证集

我想知道的是,在验证中设置不同的最小/最大值会产生什么影响,因此最终得到的值的范围不再在区间(0,1)内

这如何影响神经网络的训练


最后一个疑问:当我们使用测试集在看不见的数据上评估模型的性能时,我们是否应该再次使用训练参数规范化/标准化数据?由于这些参数实际上与经过训练的模型联系在一起。

缩放时,您通常知道数据的范围:

  • 对于图像,从0-255到0-1,这很好,您事先知道范围
  • 对于其他特征,缩放的不是均匀分布,而是高斯分布,在这种情况下,输出(或[-1,1])不得受[0,1]间隔的约束
所以通常,如果你知道你想要什么样的输出(概率或图像),你也知道你能为输入得到的真实完整范围

当您不知道输入范围时,您通常不希望在输出处有一个sigmoid,因为这对网络的约束比您应该的要大


是的,您需要使用与训练数据相同的预处理管道,这意味着经过训练的规范化参数。

好的,谢谢。我没有在输出端使用sigmoid。我正在研制一种利用多功能传感器数据的自动编码器,我无法预先预测和给出范围。谢谢你的回答,所以我不应该受[0,1][1,1]间隔的限制。事实上,如果你没有[-1,1],那就太好了。如果除以数据的标准偏差,就不会得到它。