Neural network 如果一个神经网络已经被缩放,你是否需要对它的数据进行规范化?

Neural network 如果一个神经网络已经被缩放,你是否需要对它的数据进行规范化?,neural-network,weka,normalization,training-data,perceptron,Neural Network,Weka,Normalization,Training Data,Perceptron,我目前正在尝试预处理我的训练数据,为多层感知器做好准备。我下载的数据包括20000个实例和16个属性,它们都是字母识别中像素的坐标值。在发布之前,数据本身已经从原始形式缩放为0-15之间的值 但是,既然它已经被缩放了,是否仍然需要对其执行规范化?我试着四处阅读,看看前面的例子,但发现了相互矛盾的观点。在一些论文中,它指出,缩放是一种规格化形式,正如其他人所说,规格化将使该值在0-1范围内 由于我使用WEKA,我在预处理阶段尝试了他们的规格化过滤器,它导致精度降低了2%左右,这让我认为这可能是不必

我目前正在尝试预处理我的训练数据,为多层感知器做好准备。我下载的数据包括20000个实例和16个属性,它们都是字母识别中像素的坐标值。在发布之前,数据本身已经从原始形式缩放为0-15之间的值

但是,既然它已经被缩放了,是否仍然需要对其执行规范化?我试着四处阅读,看看前面的例子,但发现了相互矛盾的观点。在一些论文中,它指出,缩放是一种规格化形式,正如其他人所说,规格化将使该值在0-1范围内

由于我使用WEKA,我在预处理阶段尝试了他们的规格化过滤器,它导致精度降低了2%左右,这让我认为这可能是不必要的。但是,我再次读到,它可能只会在以后的训练中产生积极的影响

所以我的问题是:


缩放到0-15这样的范围和将其规格化之间有什么区别?我是否应该在已经完成的缩放的基础上对其进行规格化?

在您的情况下,您不需要这样做。对数据进行规范化,使具有不同比例的属性不会决定距离运算的结果,最终决定聚类或分类结果

例如,你有两个属性:体重和收入。重量最多为10公斤和200公斤。而收入可以是10000美元和20000000美元。但大多数人的收入将分别为10000和120000,而高于此值的将是异常值。若在使用多层感知器之前并没有对数据进行标准化,那个么神经网络的结果将由这些异常值决定

在您的情况下,由于您的缩放,这种情况已经得到缓解,因此您不需要规范化