Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/three.js/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 如何仅使用一个样本规范化值?_Machine Learning_Normalization - Fatal编程技术网

Machine learning 如何仅使用一个样本规范化值?

Machine learning 如何仅使用一个样本规范化值?,machine-learning,normalization,Machine Learning,Normalization,我正在使用人工神经网络对时间序列温度预测进行研究,大多数参考文献在使用最小-最大归一化技术将输入值输入神经网络之前对其进行归一化。训练和测试数据集均已标准化。输入值是特定一天的温度、露点、降水量、压力和风速值 在测试集中只有一个样本的情况下(例如,我只有今天的天气属性来预测明天的温度),既然每个属性都有相同的最小值和最大值,我如何规范化这些值? 另外,我已经给我使用的研究的作者发了电子邮件,他们都没有回复,所以我想我会在这里寻求帮助:)将样本标准化,就好像它在训练或测试数据集中一样。它们是你训练

我正在使用
人工神经网络
对时间序列温度预测进行研究,大多数参考文献在使用
最小-最大归一化技术
将输入值输入神经网络之前对其进行归一化。训练和测试数据集均已标准化。输入值是特定一天的温度、露点、降水量、压力和风速值

在测试集中只有一个样本的情况下(例如,我只有今天的天气属性来预测明天的温度),既然每个属性都有相同的最小值和最大值,我如何规范化这些值?


另外,我已经给我使用的研究的作者发了电子邮件,他们都没有回复,所以我想我会在这里寻求帮助:)

将样本标准化,就好像它在训练或测试数据集中一样。它们是你训练的靶场,对吗

一般来说,将有限的/部分的数据放在您可以处理/已培训处理的内容的上下文中,将是从中获得有意义或经过验证的输出的唯一方法


当然,你不应该完全局限于一个样本。。由于您应该完全能够保留(并使用)前几天样本的历史记录。

标准化是以相同的方式对训练集和测试集执行的,因此您可以计算训练集的“界限”,并仅将其应用于测试集(您不应该使用测试数据来计算这些边界,因为您应该假设在创建模型时您不知道测试数据)

在这里,您似乎缺少了机器学习的核心思想。您无法在一个样本上训练预测模型。样本数指的是您收集的观察集的大小,而不是反馈给模型的数据量(因此,当你根据今天预测明天的气温时,并不意味着你只有一个样本,你需要从历史中获得大量样本,以便训练任何模型,尤其是神经网络)


因此,标准化的问题在这里并不重要,因为您只需对整个历史集进行标准化,如果您知道每个属性可以实现的值的确切边界,则可以手动对其进行标准化(例如,您测量的温度以摄氏度为单位,因此应为[-20,40](如果您生活在世界上“较软”的地区,请选择interval或samller).

感谢您的回复。因此,在测试网络性能时,这是否意味着我应该同时考虑前几天的天气值,而不仅仅是限制当前天气值的输入?无论您测试什么,您总是需要一种标准化方法。因此,您要么根本不进行标准化(如果您有一个不需要它的方法)或使用一个常量转换进行规范化,通常对一些历史数据进行计算。我们讨论的是规范化,而不是将数据用作输入。您似乎忽略了这里的区别。