Artificial intelligence 如何应用强化学习？_Artificial Intelligence_Reinforcement Learning

Artificial intelligence 如何应用强化学习？

artificial-intelligence

Artificial intelligence 如何应用强化学习？,artificial-intelligence,reinforcement-learning,Artificial Intelligence,Reinforcement Learning,我从概念上理解它。您有一个代理和一个环境。然后有一组状态，每个状态都有一个值。然后，代理选择“探索”或“利用”，并根据发生的情况修改其知识我的问题是，我似乎不知道如何将它实际应用于代码或任何实际问题。每次我查它的时候，我只会得到同样的几个方程，没有解释如何使用它们我正试图为俄罗斯方块写一个RL代理，但我似乎无法理解。如果有人能做到这一点，那就太好了我怎么知道把什么作为状态？行动呢？调整这些值所涉及的实际数学是什么？这太令人困惑了如果有人能帮我，我会非常感激。谢谢：）强化学习用于你不知道正

我从概念上理解它。您有一个代理和一个环境。然后有一组状态，每个状态都有一个值。然后，代理选择“探索”或“利用”，并根据发生的情况修改其知识

我的问题是，我似乎不知道如何将它实际应用于代码或任何实际问题。每次我查它的时候，我只会得到同样的几个方程，没有解释如何使用它们

我正试图为俄罗斯方块写一个RL代理，但我似乎无法理解。如果有人能做到这一点，那就太好了

我怎么知道把什么作为状态？行动呢？调整这些值所涉及的实际数学是什么？这太令人困惑了

如果有人能帮我，我会非常感激。谢谢：）

强化学习用于你不知道正确答案，但给出答案可以很容易地判断答案是否正确的情况

在有限或平滑的连续状态空间中查找问题，如直升机控制。在这个特定的示例中，您可以使用简化的物理模拟来教代理如何执行任务，而无需向其灌输明确的规则

如果你在谷歌上搜索强化学习到俄罗斯方块的应用程序，你会发现很多关于这个主题的文章

要了解什么构成状态、动作等，请阅读萨顿和巴顿的“强化学习”。你可以在网上免费找到它