Artificial intelligence 如果不是所有分支都探索到相同的深度,Expectimax AI是否仍能像预期的那样工作?

Artificial intelligence 如果不是所有分支都探索到相同的深度,Expectimax AI是否仍能像预期的那样工作?,artificial-intelligence,minimax,Artificial Intelligence,Minimax,我正在制作一个expectimax AI,这个游戏的分支因子是不可预测的,范围从6到20。目前,我正在每回合探索游戏树1秒钟,然后确保整个游戏树都被探索到相同的深度,但如果某个回合的分支因子急剧上升,偶尔会导致非常大的减速。当游戏树的某些部分没有被深入探索时,我是否可以停止探索?这会影响expectimax的数学特性吗?简短回答:我很确定您会失去数学保证,但这对程序性能的影响程度可能取决于游戏和棋盘评估函数 这里有一个抽象的场景,让你直观地知道,在什么地方,不同的分支长度可能会产生最大的问题:比

我正在制作一个expectimax AI,这个游戏的分支因子是不可预测的,范围从6到20。目前,我正在每回合探索游戏树1秒钟,然后确保整个游戏树都被探索到相同的深度,但如果某个回合的分支因子急剧上升,偶尔会导致非常大的减速。当游戏树的某些部分没有被深入探索时,我是否可以停止探索?这会影响expectimax的数学特性吗?

简短回答:我很确定您会失去数学保证,但这对程序性能的影响程度可能取决于游戏和棋盘评估函数

这里有一个抽象的场景,让你直观地知道,在什么地方,不同的分支长度可能会产生最大的问题:比如说,对于玩家一来说,最好的移动是需要几轮来设置的。让我们假设这个设置不是你的董事会评估职能可以接受的。在这种情况下,无论玩家2在同一时间做了什么,在未来的几步中,棋盘的得分将朝着有利于玩家1的方向摆动。如果一个分支走得足够远,而另一个分支看不到移动,那么对于玩家2来说,第一个分支似乎是一个更糟糕的选择,尽管同样的事情也会发生在另一个分支上。如果玩家2在第一个分支中的移动实际上比在第二个分支中的移动更好,这将导致次优选择

另一方面,一个完美的棋盘评估师会让这一切变得不可能,因为它会识别出玩家1正在进行他们的移动。在有些游戏中,像这样提前设置动作是不可能的。但这个案件的存在是一个危险信号

从根本上说,目前为止没有得到评估的分支机构在估计一个动作有多好时具有更大的不确定性。这有时会导致他们在不应该被选择的时候被选择,而其他时候会导致他们在应该被选择的时候没有被选择。因此,我强烈怀疑这样做会失去数学保证。也就是说,这个问题对绩效的实际影响可能很大,也可能不大

如果您将当前匝数合并到董事会评估函数中并相应地进行调整,可能会有一些解决方法。最低限度,这将允许您明确说明较短分支中增加的不确定性