Machine learning 为什么学习率有时被称为alpha?

Machine learning 为什么学习率有时被称为alpha?,machine-learning,deep-learning,terminology,Machine Learning,Deep Learning,Terminology,在查看多个代码时,我遇到一些不同的人将学习率称为“alpha”。它的根源在哪里?这是否常见?梯度下降算法中参数/权重的更新规则为 i、 我们取梯度的一个小值(倍数)并调整参数的当前值。我们采用的梯度量由α决定。α越高,电流梯度越大,α越小,所考虑的梯度越小。 这个字母被称为学习速率,因为字母越高,我们移动的速度越快,字母越低,移动的速度越慢。我不确定确切的历史起源,但一般来说,在数学和计算机科学中使用希腊字母作为速记是很常见的。阿尔法只是符号α——希腊字母表的第一个字母

在查看多个代码时,我遇到一些不同的人将学习率称为“alpha”。它的根源在哪里?这是否常见?

梯度下降算法中参数/权重的更新规则为

i、 我们取梯度的一个小值(倍数)并调整参数的当前值。我们采用的梯度量由α决定。α越高,电流梯度越大,α越小,所考虑的梯度越小。


这个字母被称为学习速率,因为字母越高,我们移动的速度越快,字母越低,移动的速度越慢。

我不确定确切的历史起源,但一般来说,在数学和计算机科学中使用希腊字母作为速记是很常见的。阿尔法只是符号α——希腊字母表的第一个字母