Machine learning 人工神经网络训练集扩展

Machine learning 人工神经网络训练集扩展,machine-learning,neural-network,backpropagation,Machine Learning,Neural Network,Backpropagation,我目前正在使用反向传播进行人工神经网络的分类工作。然而,我对规范化我正在使用的数据集有点困惑(我没有很强的统计/概率背景) 数据示例如下所示: 5.1, 3.5, 1.4, 0.2, 1 5.2, 2.7, 3.9, 1.4, 2 5.9, 3.0, 5.1, 1.8, 3 其中每个的最后一个标记是类 现在,由于我使用的是Sigmoid传递函数,我的网络显然无法输出大于1的值,因此需要对数据进行规范化/缩放 我的第一个问题;我需要同时缩放功能和类,还是只缩放类 我的第二个问题是,是否有任何“事

我目前正在使用反向传播进行人工神经网络的分类工作。然而,我对规范化我正在使用的数据集有点困惑(我没有很强的统计/概率背景)

数据示例如下所示:

5.1, 3.5, 1.4, 0.2, 1
5.2, 2.7, 3.9, 1.4, 2
5.9, 3.0, 5.1, 1.8, 3
其中每个的最后一个标记是类

现在,由于我使用的是Sigmoid传递函数,我的网络显然无法输出大于1的值,因此需要对数据进行规范化/缩放

我的第一个问题;我需要同时缩放功能和类,还是只缩放类

我的第二个问题是,是否有任何“事实上”或常用的方法来进行这种缩放

问候,,
Jack Hunt

通常建议也缩放功能。缩放应该像缩放的_feature=(feature-min(featurearray))/(max(featurearray)-min(featurearray))一样简单

因此,对于第一个属性列,新数据将是: (5.1-5.1)/(5.9-5.1); (5.2-5.1)/(5.9-5.1);
(5.9-5.1)/(5.9-5.1)

实际上,在使用机器学习算法,特别是人工神经网络时,缩放是最重要的方面之一

是的,(功能最小/最大-最小)方法是一种可能性


然而,还有一系列其他方法。例如,您可以使用z分数(根据平均值的标准偏差)。或者,还有一种称为z轴规格化的技术,其中向规格化向量添加额外的分量。有时,绝对不需要缩放。

实际上,这应该是(feature-min)/(max-min)@Alptigin-Jalayr-Hi,那么我是按属性进行规范化,如您的示例,还是按属性集进行规范化?谢谢。按每个属性,如上面的缩放示例所示。不确定你所说的属性集是什么意思(你是指每一行吗?)@AlptiginJalayr嗨,是的,我指的是行。谢谢你的回复。对这一点的理解在于规范化的定义。假设你有两列,高度和重量。所有高度都将是相同正态分布的样本,因此必须对它们集体进行归一化。类似地,所有权重都将通过计算权重列的平均值和标准偏差来标准化。不过,z分数不适用于sigmoid激活函数,因为对于非微小数据集,它们几乎可以保证包含[-1,1]之外的值。