Algorithm 如果我们想要最大化收益,那么应该如何扩展树;t为αβ-修剪?

Algorithm 如果我们想要最大化收益,那么应该如何扩展树;t为αβ-修剪?,algorithm,artificial-intelligence,minimax,alpha-beta-pruning,Algorithm,Artificial Intelligence,Minimax,Alpha Beta Pruning,嘿,伙计们,有人知道如何解决这个问题吗?我对如何得到答案感到困惑,有没有视频或任何东西教你如何扩展一棵树 假设你在玩一个轮流零和游戏,对手是一个理性的代理人,你想用两步向前看来决定你的行动。您知道,这个游戏的两步前瞻策略的完整最小最大树将是一个完整的二叉树,如图1所示,假设您可以访问一个启发式函数,该函数将为您提供完整树叶节点值的良好估计(这些估计值也写在图1中) 根据给定的启发式,如果我们想最大化αβ修剪的好处,应该如何扩展树?请按照要访问的边的顺序填写答案。 给我的答案是:e1-e4-e1

嘿,伙计们,有人知道如何解决这个问题吗?我对如何得到答案感到困惑,有没有视频或任何东西教你如何扩展一棵树

假设你在玩一个轮流零和游戏,对手是一个理性的代理人,你想用两步向前看来决定你的行动。您知道,这个游戏的两步前瞻策略的完整最小最大树将是一个完整的二叉树,如图1所示,假设您可以访问一个启发式函数,该函数将为您提供完整树叶节点值的良好估计(这些估计值也写在图1中)

根据给定的启发式,如果我们想最大化αβ修剪的好处,应该如何扩展树?请按照要访问的边的顺序填写答案。


给我的答案是:e1-e4-e10-e9-e3-e8-e2-e6-e13-e14

如果首先评估最好的子节点(从该级别第一人称玩家的角度来看),则Alpha-beta修剪将消除评估中的大部分分支,因此e1在深度1处e2之前,因为e1的分数较高,e4在e3之前,因为我们在该级别上最小化,e10在e9之前(更高分),等等。

好的,是的,我理解你的意思,基于排序,但是什么让它跳过了一些叶子,比如,如果我按照你说的做,是的,我可以提出一个排序,但是是什么让它跳过了一些,让我们假设我们在e1移动后评估节点。如果我们首先评估e4后续移动,则返回4分。我们现在开始评估e3移动游戏树。那里的第一步是e8。从玩家1的角度来看,这个值是5,比我们从e4得到的4要好。玩家2可以通过玩e4来拒绝玩家1在e3之后玩e8的机会,因此不需要评估e3-e7。在这样的浅树上,这似乎不是一个很好的优化,但这将在真实的树上产生巨大的差异,例如在国际象棋中。