Neural network 你能用反向传播来教神经网络玩回合游戏吗？_Neural Network_Backpropagation

Neural network 你能用反向传播来教神经网络玩回合游戏吗？

neural-network

Neural network 你能用反向传播来教神经网络玩回合游戏吗？,neural-network,backpropagation,Neural Network,Backpropagation,我的意思是像国际象棋，跳棋，井字游戏，2048，超级马里奥？这样的游戏，在一般的游戏中，需要多个游戏，多个动作才能完成我很确定人们可以使用遗传算法，但我想知道是否有一种方法可以用纯反向传播来训练它。我将使用什么作为目标值我曾考虑让他在比赛结束前进行多次移动，并将最终结果作为目标值，但我认为这只会训练最后一步，不是吗另一种方法是训练每个动作，但目标值是什么？你可以一步一步地做出多个有效的选择，但从长远来看，一个选择肯定会更好。如何在没有我反复尝试的情况下选择它使用Backprop不可能实现

我的意思是像国际象棋，跳棋，井字游戏，2048，超级马里奥？这样的游戏，在一般的游戏中，需要多个游戏，多个动作才能完成

我很确定人们可以使用遗传算法，但我想知道是否有一种方法可以用纯反向传播来训练它。我将使用什么作为目标值

我曾考虑让他在比赛结束前进行多次移动，并将最终结果作为目标值，但我认为这只会训练最后一步，不是吗

另一种方法是训练每个动作，但目标值是什么？你可以一步一步地做出多个有效的选择，但从长远来看，一个选择肯定会更好。如何在没有我反复尝试的情况下选择它

使用Backprop不可能实现吗？

当然可以，但您必须提供非常确定的训练数据。您必须生成所有可能的板位置，然后通过编程确定哪个移动最适合该位置。例如，基本上可以使用minimax生成所有移动

做你想做的事情的最好方法是收集输入：输出倾向于玩得很好的人类玩家的数据，然后在启用退出功能的情况下反向传播这些值，以确保网络注意到大模式

我有一个老项目，教神经网络根据你的演奏风格进行学习（），尽管我当时是神经网络的新手，所以可能没有那么有效