Machine learning 简单来说,什么是损失函数?

Machine learning 简单来说,什么是损失函数?,machine-learning,tensorflow,neural-network,loss,Machine Learning,Tensorflow,Neural Network,Loss,有人能用简单的语言和可能的例子解释一下机器学习/神经网络领域中的损失函数是什么吗 这是在我学习Tensorflow教程时出现的: 损失函数是您如何惩罚输出的函数 以下示例适用于有监督的设置,即当您知道应该得到正确的结果时。虽然即使在无监督的设置下也可以应用损失函数 假设你有一个总是预测1的模型。只有标量值1 可以将许多损失函数应用于此模型。L2是欧几里得距离 如果我传入一些值,比如2,我希望我的模型学习x**2函数,那么结果应该是4(因为2*2=4)。如果我们应用L2损失,则其计算为| | 4-

有人能用简单的语言和可能的例子解释一下机器学习/神经网络领域中的损失函数是什么吗

这是在我学习Tensorflow教程时出现的:

损失函数是您如何惩罚输出的函数

以下示例适用于有监督的设置,即当您知道应该得到正确的结果时。虽然即使在无监督的设置下也可以应用损失函数

假设你有一个总是预测1的模型。只有标量值1

可以将许多损失函数应用于此模型。L2是欧几里得距离

如果我传入一些值,比如2,我希望我的模型学习x**2函数,那么结果应该是4(因为2*2=4)。如果我们应用L2损失,则其计算为| | 4-1 | | 2=9

我们也可以弥补我们自己的损失函数。我们可以说损失函数总是10。因此,无论我们的模型输出什么,损失都是恒定的

为什么我们关心损失函数?在反向传播和神经网络的背景下,它们决定了模型的性能有多差。它们还确定要传播的最后一层的梯度,以便模型可以学习


正如其他评论所建议的,我认为你应该从基本材料开始。这里有一个很好的链接,它描述了您的网络产生的结果与预期结果之间的距离-它表明了您的模型在其预测上产生的误差大小


然后,您可以将该错误“反向传播”到您的模型中,调整其权重,使其下次更接近事实

值得注意的是,我们可以谈论不同类型的损失函数: 回归损失函数和分类损失函数

回归损失函数描述了模型预测值与标签实际值之间的差异

因此,当我们在单个时间点将预测与标签进行比较时,损失函数在标签数据上具有意义

这种损失函数通常称为误差函数或误差公式

我们用于回归模型的典型误差函数是L1和L2、Huber损失、分位数损失、对数余弦损失

注:L1损失也称为平均绝对误差。L2损失也称为均方误差或二次损失

表示因分类问题(识别特定观测所属类别的问题)中预测不准确而付出的代价

举几个例子:对数损失、焦点损失、指数损失、铰链损失、相对熵损失和其他损失


注:虽然在回归中更常用,但平方损失函数可以重新编写并用于分类

我建议你开始读一本(基础的)机器学习书,而不是“如何使用tensorflow”。如果你不知道自己在做什么,Tensorflow就不会变魔术。你有没有建议我可以关注的在线材料?可能是最好的关注点。或者谷歌的其他书籍,从Andrew Ng,这样的我们。或者如果你想要更深入的学习为导向,也许。如果你想要一个不太深的介绍,看看这个YouTube的谈话(2:30小时)这是明确,简单,简洁的定义,我一直在寻找!许多文章实际上忽略了这些要点,这对于第一次接触ML的人来说是至关重要的