Artificial intelligence 如何应用强化学习?

Artificial intelligence 如何应用强化学习?,artificial-intelligence,reinforcement-learning,Artificial Intelligence,Reinforcement Learning,我从概念上理解它。您有一个代理和一个环境。然后有一组状态,每个状态都有一个值。然后,代理选择“探索”或“利用”,并根据发生的情况修改其知识 我的问题是,我似乎不知道如何将它实际应用于代码或任何实际问题。每次我查它的时候,我只会得到同样的几个方程,没有解释如何使用它们 我正试图为俄罗斯方块写一个RL代理,但我似乎无法理解。如果有人能做到这一点,那就太好了 我怎么知道把什么作为状态?行动呢?调整这些值所涉及的实际数学是什么?这太令人困惑了 如果有人能帮我,我会非常感激。谢谢:)强化学习用于你不知道正

我从概念上理解它。您有一个代理和一个环境。然后有一组状态,每个状态都有一个值。然后,代理选择“探索”或“利用”,并根据发生的情况修改其知识

我的问题是,我似乎不知道如何将它实际应用于代码或任何实际问题。每次我查它的时候,我只会得到同样的几个方程,没有解释如何使用它们

我正试图为俄罗斯方块写一个RL代理,但我似乎无法理解。如果有人能做到这一点,那就太好了

我怎么知道把什么作为状态?行动呢?调整这些值所涉及的实际数学是什么?这太令人困惑了


如果有人能帮我,我会非常感激。谢谢:)

强化学习用于你不知道正确答案,但给出答案可以很容易地判断答案是否正确的情况

在有限或平滑的连续状态空间中查找问题,如直升机控制。在这个特定的示例中,您可以使用简化的物理模拟来教代理如何执行任务,而无需向其灌输明确的规则

如果你在谷歌上搜索强化学习到俄罗斯方块的应用程序,你会发现很多关于这个主题的文章

要了解什么构成状态、动作等,请阅读萨顿和巴顿的“强化学习”。你可以在网上免费找到它