Machine learning 机器学习(无监督方法)

Machine learning 机器学习(无监督方法),machine-learning,artificial-intelligence,Machine Learning,Artificial Intelligence,我有一个关于强化学习的问题。如果我们在无监督方法中使用一种机制来发现环境的响应以提高其性能,那么该方法仍然是无监督的吗 换句话说,利用环境的响应,是一种有监督的方法,还是我们可以以无监督的方式来进行?如果是,如何描述?无监督学习描述了一类问题,其中模型在其培训阶段没有提供答案,无论在当前上下文中这可能意味着什么 集群是一个典型的例子。在聚类问题中,人们只是寻找训练数据中固有的结构或分组,而不是试图区分正确的数据点和错误的数据点 你的问题很模糊,但我相信你是在问,即使我们有一个被禁止的算法来执行训

我有一个关于强化学习的问题。如果我们在无监督方法中使用一种机制来发现环境的响应以提高其性能,那么该方法仍然是无监督的吗


换句话说,利用环境的响应,是一种有监督的方法,还是我们可以以无监督的方式来进行?如果是,如何描述?

无监督学习描述了一类问题,其中模型在其培训阶段没有提供答案,无论在当前上下文中这可能意味着什么

集群是一个典型的例子。在聚类问题中,人们只是寻找训练数据中固有的结构或分组,而不是试图区分正确的数据点和错误的数据点


你的问题很模糊,但我相信你是在问,即使我们有一个被禁止的算法来执行训练,我们是否可以将训练方法称为无监督的训练方法。答案是肯定的;这个词只是一个词。所有的学习算法都有其固有的禁止结构——算法,因此在某种意义上是有监督的。

无监督学习描述了一类问题,其中模型在其训练阶段没有提供答案,无论在当前上下文中可能意味着什么

集群是一个典型的例子。在聚类问题中,人们只是寻找训练数据中固有的结构或分组,而不是试图区分正确的数据点和错误的数据点


你的问题很模糊,但我相信你是在问,即使我们有一个被禁止的算法来执行训练,我们是否可以将训练方法称为无监督的训练方法。答案是肯定的;这个词只是一个词。所有的学习算法都有固有的被禁止的结构——算法,因此在某种意义上是有监督的。

我不同意@phs。强化学习在文献中被视为:

完全独立的第三种培训方法——因此它不受监督或不受监督,只是简单的强化 它有时被标记为受监督的,因为它与这个范例有着更强烈的相似性
因此,如果该算法以强化方式进行训练且无监督,您可以将其称为无监督强化混合或类似的东西,但不再是无监督的,因为强化学习需要一些关于世界的额外知识,与数据表示中编码的反馈不同,反馈不存储在数据表示中,它们更像是真正的标签。

我不同意@phs。强化学习在文献中被视为:

完全独立的第三种培训方法——因此它不受监督或不受监督,只是简单的强化 它有时被标记为受监督的,因为它与这个范例有着更强烈的相似性
因此,如果该算法以强化方式进行训练且无监督,您可以将其称为无监督强化混合或类似的东西,但不再是无监督的,因为强化学习需要一些关于世界的额外知识,与数据表示中编码的反馈不同,反馈不存储在数据表示中,它们更像是真实的标签。

在相对常见的情况下尤其如此,在这种情况下,强化学习被用于制定未来行为的策略,目的是在找到可接受的策略后关闭学习。在相对常见的情况下尤其如此,强化学习被用于制定未来行为策略,目的是在找到可接受的策略后关闭学习。