Machine learning 强化学习迷你高尔夫游戏_Machine Learning_Reinforcement Learning

Machine learning 强化学习迷你高尔夫游戏

machine-learning

Machine learning 强化学习迷你高尔夫游戏,machine-learning,reinforcement-learning,Machine Learning,Reinforcement Learning,我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏我想给游戏引擎提供输入（角度和力）获得球的最终位置根据最终职位计算奖励迭代过程直到成功我想我可以通过使用贪婪方法或函数近似来实现这一点。我想知道这是否可行，并想找到一个类似的例子。在文献中，强化学习是最接近人工通用智能的东西，所以是的，你可以将它应用到这个迷你高尔夫游戏中以下是布局：说明：球在场地上的位置（x、y、z）动作：角度、力奖励：球离洞的距离根据你的领域有多大，这个问题应该很容易解决我想我可以通过使用贪婪方法

我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏

我想给游戏引擎提供输入（角度和力）
获得球的最终位置
根据最终职位计算奖励
迭代过程直到成功

我想我可以通过使用贪婪方法或函数近似来实现这一点。我想知道这是否可行，并想找到一个类似的例子。

在文献中，强化学习是最接近人工通用智能的东西，所以是的，你可以将它应用到这个迷你高尔夫游戏中

以下是布局：

说明：球在场地上的位置（x、y、z）

动作：角度、力

奖励：球离洞的距离

根据你的领域有多大，这个问题应该很容易解决

我想我可以通过使用贪婪方法或函数近似来实现这一点

你肯定会想至少使用一种电子贪婪的方法来促进早期情节中的探索

为了简化这个问题，我首先考虑一个2D，或者甚至是1D的例子，这样你就可以熟悉算法了。对于1D情况，您的状态将是球所在的位置。你的动作是施加在球上的力的大小。奖励可以根据你的球离球门柱有多远而定

如果您愿意，我可以为您编写此环境的代码。

欢迎使用SO；不幸的是，你的第一个问题（“这是否可能”）太宽泛了，而你的第二个问题（“找到类似的例子”）离题了，正如在中明确解释的那样，你可以使用-1作为奖励，每只蝙蝠一个，当你遇到洞时为零。这将最大限度地减少蝙蝠的数量。是的，由于这个问题是有限的，这肯定也有效。非常感谢您的回复。