Machine learning 强化学习迷你高尔夫游戏

Machine learning 强化学习迷你高尔夫游戏,machine-learning,reinforcement-learning,Machine Learning,Reinforcement Learning,我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏 我想给游戏引擎提供输入(角度和力) 获得球的最终位置 根据最终职位计算奖励 迭代过程直到成功 我想我可以通过使用贪婪方法或函数近似来实现这一点。我想知道这是否可行,并想找到一个类似的例子。在文献中,强化学习是最接近人工通用智能的东西,所以是的,你可以将它应用到这个迷你高尔夫游戏中 以下是布局: 说明:球在场地上的位置(x、y、z) 动作:角度、力 奖励:球离洞的距离 根据你的领域有多大,这个问题应该很容易解决 我想我可以通过使用贪婪方法

我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏

  • 我想给游戏引擎提供输入(角度和力)
  • 获得球的最终位置
  • 根据最终职位计算奖励
  • 迭代过程直到成功

我想我可以通过使用贪婪方法或函数近似来实现这一点。我想知道这是否可行,并想找到一个类似的例子。

在文献中,强化学习是最接近人工通用智能的东西,所以是的,你可以将它应用到这个迷你高尔夫游戏中

以下是布局:

说明:球在场地上的位置(x、y、z)

动作:角度、力

奖励:球离洞的距离

根据你的领域有多大,这个问题应该很容易解决

我想我可以通过使用贪婪方法或函数近似来实现这一点

你肯定会想至少使用一种电子贪婪的方法来促进早期情节中的探索

为了简化这个问题,我首先考虑一个2D,或者甚至是1D的例子,这样你就可以熟悉算法了。 对于1D情况,您的状态将是球所在的位置。你的动作是施加在球上的力的大小。奖励可以根据你的球离球门柱有多远而定


如果您愿意,我可以为您编写此环境的代码。

欢迎使用SO;不幸的是,你的第一个问题(“这是否可能”)太宽泛了,而你的第二个问题(“找到类似的例子”)离题了,正如在中明确解释的那样,你可以使用-1作为奖励,每只蝙蝠一个,当你遇到洞时为零。这将最大限度地减少蝙蝠的数量。是的,由于这个问题是有限的,这肯定也有效。非常感谢您的回复。