Machine learning 我们会计算*test*集合上的成本J(θ;)吗?
我很确定答案是否定的,但我想确认一下 当训练神经网络或其他学习算法时,我们将计算代价函数J(θ),作为我们的算法与训练数据拟合程度的表达式(值越高,表示它与数据的拟合程度越低)。在训练我们的算法时,我们通常希望看到J(θ)随着梯度下降的每次迭代而下降 但我只是好奇,根据我们的测试数据计算J(θ)会有值吗Machine learning 我们会计算*test*集合上的成本J(θ;)吗?,machine-learning,loss,loss-function,Machine Learning,Loss,Loss Function,我很确定答案是否定的,但我想确认一下 当训练神经网络或其他学习算法时,我们将计算代价函数J(θ),作为我们的算法与训练数据拟合程度的表达式(值越高,表示它与数据的拟合程度越低)。在训练我们的算法时,我们通常希望看到J(θ)随着梯度下降的每次迭代而下降 但我只是好奇,根据我们的测试数据计算J(θ)会有值吗 我认为答案是否定的,因为我们只对测试数据进行一次评估,我们只会得到一个J(θ)值,我认为除了与其他值比较外,它没有任何意义。你的问题涉及到一个关于术语的非常常见的歧义:验证和测试集之间的歧义(和
我认为答案是否定的,因为我们只对测试数据进行一次评估,我们只会得到一个J(θ)值,我认为除了与其他值比较外,它没有任何意义。你的问题涉及到一个关于术语的非常常见的歧义:验证和测试集之间的歧义(和可能有助于解决此问题) 因此,假设您确实引用了正确的测试集,而不是验证集,那么:
你说得对,我脑子里有分类设置。除了好奇,我仍然不确定在分类设置中计算测试集的成本值是多少。但你说得对,在回归设置中,成本可能与业务目标相等。我很好奇你认为在t上会做什么验证集。你可以使用成本作为选择模型的衡量标准,但如果业务目标不同(例如准确性),你也可以使用它们。@Stephen在分类1中)通常你不会关心测试成本,正如我在回答2中已经暗示的那样2)对于使用验证集的模型选择,通常您会使用业务指标,而不是成本。一般来说,如果您将讨论限制在仅分类设置中,那么您在帖子中表达的直觉是正确的。进一步思考:我猜在验证集上计算成本的一个重要原因是:t(甚至是测试集)的意思是,有一个通用的度量标准来比较这些数据集上的性能可能会很有帮助,因为这可以让你感觉到你可能过度拟合了多少。@Stephen不适合测试集,因为这需要对它进行重复评估(您可以通过损失曲线的偏差来诊断过度拟合,而不是通过比较值)。对于验证集,您可以,但也可以出于相同目的使用业务度量