Python 如何实现强化学习模型？_Python_Reinforcement Learning

Python 如何实现强化学习模型？

python

Python 如何实现强化学习模型？,python,reinforcement-learning,Python,Reinforcement Learning,我对强化学习有一些疑问。我研究了强化学习的所有数学背景，但我无法编写这个模型我对定义一个环境感到非常困惑。我们能用OpenAI健身房解决所有问题吗？这对我来说毫无意义。例如，玩游戏不同于股票预测。但我怎么会在这两种情况下看到有人在使用OpenAI健身房呢我还发现了下面的列表。论文到底是什么？它们是实施强化学习模型的框架吗你能给我一个链接、来源、视频、课程或任何能让我明白的东西吗。OpenAI健身房是一个环境集合。如果你学习了RL的数学背景，那么健身房就是MDP的集合。然后由您将RL算法与

我对强化学习有一些疑问。我研究了强化学习的所有数学背景，但我无法编写这个模型

我对定义一个环境感到非常困惑。我们能用OpenAI健身房解决所有问题吗？这对我来说毫无意义。例如，玩游戏不同于股票预测。但我怎么会在这两种情况下看到有人在使用OpenAI健身房呢

我还发现了下面的列表。论文到底是什么？它们是实施强化学习模型的框架吗

你能给我一个链接、来源、视频、课程或任何能让我明白的东西吗。

OpenAI健身房是一个环境集合。如果你学习了RL的数学背景，那么健身房就是MDP的集合。然后由您将RL算法与这些MDP挂钩，并进行实际学习

您发现的列表可能有点旧，因为rllab最近被重命名。我不知道它们中的大多数，但我想说它们是已经实现的RL算法库（至少这就是rllab和OpenAI基线）。你可以看看他们的代码，看看他们是如何实现不同的RL算法的。

这个网站应该会给你很多帮助：谢谢你的回复，我在想，对于一个简单的游戏，我们可以使用贪婪世界环境。但是如果我想用RL来预测股票呢。每个州我有三个动作：卖出、买入、持有。所以不同的问题是非常不同的，我怎样才能使OpenAI适合我的问题？我应该检查所有的环境吗？你不需要使用OpenAI健身房。但是，您可以查看他们的文档（）以了解他们是如何实现环境的，并以此作为实现您自己的环境的灵感。所以，是的，这是一个好主意，去所有的环境。