Machine learning 在强化学习中,主体和环境是有不同的状态还是只有一种状态?

Machine learning 在强化学习中,主体和环境是有不同的状态还是只有一种状态?,machine-learning,reinforcement-learning,markov-decision-process,mdp,Machine Learning,Reinforcement Learning,Markov Decision Process,Mdp,是环境状态还是代理?在我读到的地方,环境也有状态。两者有什么不同 状态表示从代理看到的环境 如果你想说某个属性是代理的一部分,比如说你有一辆车,你声明它的速度属于代理,那么状态包含这个属性,但它是环境的一部分,因为你的代理存在于环境中 然后,当您有多个代理时,所有代理都可以通过一个状态可视化环境,但每个代理都可能不同 例如 如果您有多个机器人玩扑克牌,每个机器人将把环境表示为可见的牌和手中的牌。因此,您的所有代理(机器人)对环境的感知将不同,从而产生不同的状态来表示它们。在这种情况下,您可以说代

是环境状态还是代理?在我读到的地方,环境也有状态。两者有什么不同


状态表示从代理看到的环境

如果你想说某个属性是代理的一部分,比如说你有一辆车,你声明它的速度属于代理,那么状态包含这个属性,但它是环境的一部分,因为你的代理存在于环境中

然后,当您有多个代理时,所有代理都可以通过一个状态可视化环境,但每个代理都可能不同

例如
如果您有多个机器人玩扑克牌,每个机器人将把环境表示为可见的牌和手中的牌。因此,您的所有代理(机器人)对环境的感知将不同,从而产生不同的状态来表示它们。在这种情况下,您可以说代理的状态,这只是一个措辞问题。

所以通常状态是环境的状态?是的,代理可以使用的环境