Machine learning 神经网络具有正态分布数据是否重要?

Machine learning 神经网络具有正态分布数据是否重要?,machine-learning,statistics,neural-network,normalization,normal-distribution,Machine Learning,Statistics,Neural Network,Normalization,Normal Distribution,所以,对数据进行标准化处理的一件事就是对其进行标准化,使其具有正态分布的数据,平均值为0,标准偏差为1,对吗?但是,如果数据不是正态分布的呢 此外,所需的输出也必须是正态分布的吗?如果我想让我的前馈网络在两类(-1和1)之间分类,那就不可能标准化为均值为0的正态分布和标准差为1的正态分布,对吗 前馈网络是非参数的,对吗?因此,如果是,数据标准化是否仍然重要?人们为什么要将其标准化呢?标准化特征并不是为了使数据符合正态分布,而是为了将特征值放在一个已知的范围内,从而使算法更容易从数据中学习。这是因

所以,对数据进行标准化处理的一件事就是对其进行标准化,使其具有正态分布的数据,平均值为0,标准偏差为1,对吗?但是,如果数据不是正态分布的呢

此外,所需的输出也必须是正态分布的吗?如果我想让我的前馈网络在两类(-1和1)之间分类,那就不可能标准化为均值为0的正态分布和标准差为1的正态分布,对吗


前馈网络是非参数的,对吗?因此,如果是,数据标准化是否仍然重要?人们为什么要将其标准化呢?

标准化特征并不是为了使数据符合正态分布,而是为了将特征值放在一个已知的范围内,从而使算法更容易从数据中学习。这是因为大多数算法不是缩放/平移不变的。例如,决策树既具有缩放不变性,又具有平移不变性,因此进行规范化对树的性能没有影响

此外,所需的输出也必须是正态分布的吗

不,那不是问题。输出是任何输出。您必须确保网络最后一层的激活功能可以做出您想要的预测(即:Sigmoid激活不能输出负值或值>1)

前馈网络是非参数的,对吗

不,它们通常被认为是参数化的。参数化/非参数化的定义并不难。人们谈论这件事时可能会有一些不同的意思

因此,如果是这样的话,标准化数据是否仍然很重要

这些事情根本没有关系

为什么人们要将其标准化


这是我提到的第一件事,它使学习变得更容易/可能。

可能重复感谢您的回复。在您的观点中,您提到了使用标准化来确保输入在特定范围内。但我读过一些人使用标准化来确保输入/输出具有平均值0和均匀方差(即使它们已经在一个范围内)。为什么?我刚才回答了为什么。这是为了使优化/学习更容易。或者将输出置于激活功能实际可达到的范围内。