Machine learning 在强化学习中，主体和环境是有不同的状态还是只有一种状态？_Machine Learning_Reinforcement Learning_Markov Decision Process_Mdp

Machine learning 在强化学习中，主体和环境是有不同的状态还是只有一种状态？

machine-learning

Machine learning 在强化学习中，主体和环境是有不同的状态还是只有一种状态？,machine-learning,reinforcement-learning,markov-decision-process,mdp,Machine Learning,Reinforcement Learning,Markov Decision Process,Mdp,是环境状态还是代理？在我读到的地方，环境也有状态。两者有什么不同状态表示从代理看到的环境如果你想说某个属性是代理的一部分，比如说你有一辆车，你声明它的速度属于代理，那么状态包含这个属性，但它是环境的一部分，因为你的代理存在于环境中然后，当您有多个代理时，所有代理都可以通过一个状态可视化环境，但每个代理都可能不同例如如果您有多个机器人玩扑克牌，每个机器人将把环境表示为可见的牌和手中的牌。因此，您的所有代理（机器人）对环境的感知将不同，从而产生不同的状态来表示它们。在这种情况下，您可以说代

是环境状态还是代理？在我读到的地方，环境也有状态。两者有什么不同

状态表示从代理看到的环境

如果你想说某个属性是代理的一部分，比如说你有一辆车，你声明它的速度属于代理，那么状态包含这个属性，但它是环境的一部分，因为你的代理存在于环境中

然后，当您有多个代理时，所有代理都可以通过一个状态可视化环境，但每个代理都可能不同

例如

如果您有多个机器人玩扑克牌，每个机器人将把环境表示为可见的牌和手中的牌。因此，您的所有代理（机器人）对环境的感知将不同，从而产生不同的状态来表示它们。在这种情况下，您可以说代理的状态，这只是一个措辞问题。

所以通常状态是环境的状态？是的，代理可以使用的环境