Artificial intelligence minimax:如果min不是最优的,会发生什么

Artificial intelligence minimax:如果min不是最优的,会发生什么,artificial-intelligence,minimax,Artificial Intelligence,Minimax,对极大极小算法的描述是,两个玩家都必须玩最优,这样算法才是最优的。直觉上这是可以理解的。但是colud有人具体化了,或者证明了如果min打得不好会发生什么 thx最佳答案的定义是,你的游戏是为了最小化对手的最佳答案的“分数”(或任何你衡量的),这是由最小化你的最佳答案分数的游戏定义的,以此类推 因此,根据定义,如果你没有发挥最佳,你的对手至少有一条路径,将给他一个更高的分数比他的最佳分数,如果你发挥最佳 找出最佳方案的一种方法是对整个游戏树进行暴力攻击。对于不太重要的问题,您可以使用alpha-

对极大极小算法的描述是,两个玩家都必须玩最优,这样算法才是最优的。直觉上这是可以理解的。但是colud有人具体化了,或者证明了如果min打得不好会发生什么

thx

最佳答案的定义是,你的游戏是为了最小化对手的最佳答案的“分数”(或任何你衡量的),这是由最小化你的最佳答案分数的游戏定义的,以此类推

因此,根据定义,如果你没有发挥最佳,你的对手至少有一条路径,将给他一个更高的分数比他的最佳分数,如果你发挥最佳

找出最佳方案的一种方法是对整个游戏树进行暴力攻击。对于不太重要的问题,您可以使用alpha-beta搜索,它可以保证优化,而无需搜索整个树。如果你的树仍然太复杂,你需要一个启发式算法来估计一个“位置”的分数,并在一定的深度上停止


这可以理解吗?

我对这个确切的问题有疑问

当你想一想的时候,你会发现极小极大图包含了所有可能的游戏,包括坏游戏。因此,如果一个玩家玩了一个次优游戏,那么这个游戏就是树的一部分——但是为了更好的游戏而被放弃了

它类似于alpha-beta。我一直在想如果我故意牺牲一些碎片来创造空间,然后在空隙中做出一个胜利的动作,会发生什么。还有更好的办法

对于alpha-beta-让我们说一系列失败的动作,然后是致命的动作,实际上在树中-但是在这种情况下,alpha和beta充当窗口过滤器“a 在任何情况下,这两种算法都会重新计算每一步,这样,如果玩家玩一个次优游戏,它们将打开对对手有利的图形分支


重复冲洗。

考虑一个最小节点,其子节点是终端节点。如果MIN播放的次优,则节点的值大于或等于MIN播放的最佳值。因此,作为最小节点的父节点的最大节点的值只能增加。这个论点可以通过一个简单的归纳一直延伸到根。如果MIN的次优策略是可预测的,那么可以比minimax策略做得更好。例如,如果MIN总是落入某种陷阱并失败,那么设置陷阱就保证了胜利,即使MIN实际上有毁灭性的反应


资料来源:

那么Max获胜的机会更大。为了澄清,如果min没有发挥最佳效果,这意味着你没有实现minimax算法,而是一个有缺陷的版本。