Python 如何实现强化学习模型?

Python 如何实现强化学习模型?,python,reinforcement-learning,Python,Reinforcement Learning,我对强化学习有一些疑问。我研究了强化学习的所有数学背景,但我无法编写这个模型 我对定义一个环境感到非常困惑。我们能用OpenAI健身房解决所有问题吗?这对我来说毫无意义。例如,玩游戏不同于股票预测。但我怎么会在这两种情况下看到有人在使用OpenAI健身房呢 我还发现了下面的列表。论文到底是什么?它们是实施强化学习模型的框架吗 你能给我一个链接、来源、视频、课程或任何能让我明白的东西吗。OpenAI健身房是一个环境集合。如果你学习了RL的数学背景,那么健身房就是MDP的集合。然后由您将RL算法与

我对强化学习有一些疑问。我研究了强化学习的所有数学背景,但我无法编写这个模型

我对定义一个环境感到非常困惑。我们能用OpenAI健身房解决所有问题吗?这对我来说毫无意义。例如,玩游戏不同于股票预测。但我怎么会在这两种情况下看到有人在使用OpenAI健身房呢

我还发现了下面的列表。论文到底是什么?它们是实施强化学习模型的框架吗


你能给我一个链接、来源、视频、课程或任何能让我明白的东西吗。

OpenAI健身房是一个环境集合。如果你学习了RL的数学背景,那么健身房就是MDP的集合。然后由您将RL算法与这些MDP挂钩,并进行实际学习


您发现的列表可能有点旧,因为rllab最近被重命名。我不知道它们中的大多数,但我想说它们是已经实现的RL算法库(至少这就是rllab和OpenAI基线)。你可以看看他们的代码,看看他们是如何实现不同的RL算法的。

这个网站应该会给你很多帮助:谢谢你的回复,我在想,对于一个简单的游戏,我们可以使用贪婪世界环境。但是如果我想用RL来预测股票呢。每个州我有三个动作:卖出、买入、持有。所以不同的问题是非常不同的,我怎样才能使OpenAI适合我的问题?我应该检查所有的环境吗?你不需要使用OpenAI健身房。但是,您可以查看他们的文档()以了解他们是如何实现环境的,并以此作为实现您自己的环境的灵感。所以,是的,这是一个好主意,去所有的环境。