Neural network 你能用反向传播来教神经网络玩回合游戏吗?

Neural network 你能用反向传播来教神经网络玩回合游戏吗?,neural-network,backpropagation,Neural Network,Backpropagation,我的意思是像国际象棋,跳棋,井字游戏,2048,超级马里奥?这样的游戏,在一般的游戏中,需要多个游戏,多个动作才能完成 我很确定人们可以使用遗传算法,但我想知道是否有一种方法可以用纯反向传播来训练它。我将使用什么作为目标值 我曾考虑让他在比赛结束前进行多次移动,并将最终结果作为目标值,但我认为这只会训练最后一步,不是吗 另一种方法是训练每个动作,但目标值是什么?你可以一步一步地做出多个有效的选择,但从长远来看,一个选择肯定会更好。如何在没有我反复尝试的情况下选择它 使用Backprop不可能实现

我的意思是像国际象棋,跳棋,井字游戏,2048,超级马里奥?这样的游戏,在一般的游戏中,需要多个游戏,多个动作才能完成

我很确定人们可以使用遗传算法,但我想知道是否有一种方法可以用纯反向传播来训练它。我将使用什么作为目标值

我曾考虑让他在比赛结束前进行多次移动,并将最终结果作为目标值,但我认为这只会训练最后一步,不是吗

另一种方法是训练每个动作,但目标值是什么?你可以一步一步地做出多个有效的选择,但从长远来看,一个选择肯定会更好。如何在没有我反复尝试的情况下选择它


使用Backprop不可能实现吗?

当然可以,但您必须提供非常确定的训练数据。您必须生成所有可能的板位置,然后通过编程确定哪个移动最适合该位置。例如,基本上可以使用minimax生成所有移动

做你想做的事情的最好方法是收集输入:输出倾向于玩得很好的人类玩家的数据,然后在启用退出功能的情况下反向传播这些值,以确保网络注意到大模式

我有一个老项目,教神经网络根据你的演奏风格进行学习(),尽管我当时是神经网络的新手,所以可能没有那么有效