Java NIM游戏和AI玩家使用Minimax算法-AI做出失败的动作_Java_Algorithm_Minimax

Java NIM游戏和AI玩家使用Minimax算法-AI做出失败的动作

java algorithm

Java NIM游戏和AI玩家使用Minimax算法-AI做出失败的动作,java,algorithm,minimax,Java,Algorithm,Minimax,我有一个任务要写一个NIM游戏，里面有一个人类玩家和一个AI玩家。这个游戏是“吝啬鬼”（最后一个必须拿起棍子的人输了）。人工智能应该使用极大极小算法，但它的动作会让它更快地失去，我不明白为什么。我已经走了好几天的死胡同了。 Minimax算法的要点是不丢失，如果它处于丢失位置，则尽可能延迟丢失的动作，对吗考虑以下几点：敏捷板=新敏捷板（34,2） 34=棒的二进制编码位置，2堆2个棒 2=桩的数量我们从这个场景开始，用*字符表示一根棍子： Row 0: ** Row 1: ** 在这

我有一个任务要写一个NIM游戏，里面有一个人类玩家和一个AI玩家。这个游戏是“吝啬鬼”（最后一个必须拿起棍子的人输了）。人工智能应该使用极大极小算法，但它的动作会让它更快地失去，我不明白为什么。我已经走了好几天的死胡同了。 Minimax算法的要点是不丢失，如果它处于丢失位置，则尽可能延迟丢失的动作，对吗

考虑以下几点：

敏捷板=新敏捷板（34,2）

34=棒的二进制编码位置，2堆2个棒
2=桩的数量

我们从这个场景开始，用*字符表示一根棍子：

Row 0: **
Row 1: **

在这种特殊的电路板情况下，Minimax算法总是提出“从第1行移除2根棍子”的移动。这显然是一个糟糕的举动，因为它在第0行留下了2根棍子，人类玩家可以从第0行拾取1根棍子并赢得游戏

AI玩家应该从任意一堆中选择一根棍子。这就留给了人类玩家：

Row 0: *
Row 1: **

因此，无论人类玩家现在做哪一步，当计算机在那之后做下一步时，人类玩家总是会输。显然是一个更好的策略，但为什么算法不建议这样做呢

public class Minimax
{

    public Move nextMove;

    public int evaluateComputerMove(NIMBoard board, int depth)
    {
        int maxValue = -2;
        int calculated;
        if(board.isFinal())
        {
            return -1;
        }
        for(Move n : this.generateSuccessors(board))
        {
            NIMBoard newBoard = new NIMBoard(board.getPos(), board.getNumPiles());
            newBoard.parseMove(n);
            calculated = this.evaluateHumanMove(newBoard, depth + 1);
            if(calculated > maxValue)
            {
                maxValue = calculated;
                if(depth == 0)
                {
                    System.out.println("Setting next move");
                    this.nextMove = n;
                }
            }

        }

        if(maxValue == -2)
        {
            return 0;
        }
        return maxValue;
    }

    public int evaluateHumanMove(NIMBoard board, int depth)
    {
        int minValue = 2;
        int calculated;
        if(board.isFinal())
        {
            return 1;
        }
        for(Move n : this.generateSuccessors(board))
        {
            NIMBoard newBoard = new NIMBoard(board.getPos(), board.getNumPiles());
            newBoard.parseMove(n);
            calculated = this.evaluateComputerMove(newBoard, depth + 1);
            // minValue = Integer.min(this.evaluateComputerMove(newBoard, depth + 1), minValue);
            if(calculated < minValue)
            {
                minValue = calculated;
            }
        }
        if(minValue == 2)
        {
            return 0;
        }

        return minValue;
    }

    public ArrayList<Move> generateSuccessors(NIMBoard start)
    {
        ArrayList<Move> successors = new ArrayList<Move>();
        for(int i = start.getNumPiles() - 1; i >= 0; i--)
        {
            for(long j = start.getCountForPile(i); j > 0; j--)
            {
                Move newMove = new Move(i, j);
                successors.add(newMove);
            }
        }

        return successors;
    }
}

公共类极小极大
{
下一步公共行动；
公共int evaluateComputerMove（智能板，int深度）
{
int maxValue=-2；
int计算；
if（board.isFinal（））
{
返回-1；
}
对于（移动n：此.generateSuccessors（板））
{
NIMBoard newBoard=新的NIMBoard（board.getPos（），board.getNumPiles（））；
新板移动（n）；
计算=此。evaluateHumanMove（新板，深度+1）；
如果（计算>最大值）
{
最大值=计算值；
如果（深度==0）
{
System.out.println（“设置下一步”）；
this.nextMove=n；
}
}
}
如果（最大值==-2）
{
返回0；
}
返回最大值；
}
公共int evaluateHumanMove（敏捷板，int深度）
{
int minValue=2；
int计算；
if（board.isFinal（））
{
返回1；
}
对于（移动n：此.generateSuccessors（板））
{
NIMBoard newBoard=新的NIMBoard（board.getPos（），board.getNumPiles（））；
新板移动（n）；
计算=此。evaluateComputerMove（新板，深度+1）；
//minValue=Integer.min（此.evaluateComputerMove（新板，深度+1），minValue）；
如果（计算值<最小值）
{
最小值=计算值；
}
}
如果（最小值==2）
{
返回0；
}
返回最小值；
}
公共ArrayList generateSuccessors（NIMBoard start）
{
ArrayList继承者=新的ArrayList（）；
对于（int i=start.getNumPiles（）-1；i>=0；i--）
{
对于（长j=start.getCountForPile（i）；j>0；j--）
{
移动新移动=新移动（i，j）；
继承人。添加（新移动）；
}
}
归还继承人；
}
}

公共类NIMBoard
{
/**
*我们使用4位来存储棍子的数量，从而得到这些数字
*最大值：
*-16桩
*-每桩15根
*/
专用静态整数桩位大小=4；
私人长pos；
私有整数；
私人长桩；
/**
*实例化一个新的NIM板
*@param pos每个桩中的杆数
*@param numPiles桩数
*/
公共灵巧板（长位置，整数）
{
超级（）；
this.pos=pos；
this.numPiles=numPiles；
this.pileMask=（long）Math.pow（2，NIMBoard.PILE\u BIT\u SIZE）-1；
}
/**
*这是终局板吗？
*@如果只剩下一根棍子，返回true
*/
公共布尔值isFinal（）
{
返回此.onePileHasOnlyOneStick（）；
}
/**
*找出板子上是否有一堆只有一根木棍的木桩
*@如果是，则返回true
*/
公共布尔值onePileHasOnlyOneStick（）
{        
整数计数=0；
for（int i=0；i1）
{
返回false；
}
返回true；
}
public int getNumPiles（）
{
返回这个.numPiles；
}
公共长getPos（）
{
返回此.pos；
}
公共长GetCountInFile（整数堆）
{
返回this.pos&（this.pileMask>（pile*NIMBoard.pile\u BIT\u SIZE）；
}
公共移动（移动）
{
this.pos=this.pos-（move.getCount（）对于人工智能来说，你认为是更好的一步，实际上并不是更好的一步。在这种情况下，人类玩家会从第一排拿走两个木棍，而计算机仍然会被卡住拿最后一个木棍。这并不保证你的程序能正常工作，但我认为你应该尝试一些不同的测试用例。例如，see如果你认为人类玩家会输，AI会做什么。
对于人类玩家，你不应该有不同的功能。你应该假设两个玩家都使用最好的策略，因为你在实施它，所以两个玩家的代码应该是相同的
该算法的思想不是将状态id分配给当前状态，该状态id等于最小状态id，该最小状态id不与可能结束的状态的任何状态id重叠。如果可以使用id 0、1和3移动并到达状态，则当前状态应具有状态id 2。
任何丢失的状态都应该有id
public class NIMBoard
{
    /**
     * We use 4 bits to store the number of sticks which gives us these
     * maximums:
     * - 16 piles
     * - 15 sticks per pile
     */
    private static int PILE_BIT_SIZE = 4;
    private long pos;
    private int numPiles;
    private long pileMask;

    /**
     * Instantiate a new NIM board
     * @param pos Number of sticks in each pile
     * @param numPiles Number of piles
     */
    public NIMBoard(long pos, int numPiles)
    {
        super();
        this.pos        = pos;
        this.numPiles   = numPiles;

        this.pileMask   = (long) Math.pow(2, NIMBoard.PILE_BIT_SIZE) - 1;
    }

    /**
     * Is this an endgame board?
     * @return true if there's only one stick left
     */
    public boolean isFinal()
    {
        return this.onePileHasOnlyOneStick();
    }

    /**
     * Figure out if the board has a pile with only one stick in it
     * @return true if yes
     */
    public boolean onePileHasOnlyOneStick()
    {        
        int count = 0;

        for(int i = 0; i < this.numPiles; i++)
        {
            count += this.getCountForPile(i);
        }

        if(count > 1)
        {
            return false;
        }

        return true;
    }


    public int getNumPiles()
    {
        return this.numPiles;
    }

    public long getPos()
    {
        return this.pos;
    }


    public long getCountInPile(int pile)
    {
        return this.pos & (this.pileMask << (pile * NIMBoard.PILE_BIT_SIZE));
    }

    public long getCountForPile(int pile)
    {
        return this.getCountInPile(pile) >> (pile * NIMBoard.PILE_BIT_SIZE);
    }

    public void parseMove(Move move)
    {
        this.pos = this.pos - (move.getCount() << (move.getPile() * NIMBoard.PILE_BIT_SIZE));
    }

    @Override
    public String toString()
    {
        String tmp = "";
        for(int i = 0; i < this.numPiles; i++)
        {
            tmp += "Row " + i + "\t";
            for(int j = 0; j < this.getCountForPile(i); j++)
            {
                tmp += "*";
            }
            tmp += System.lineSeparator();
        }

        return tmp.trim();
    }

}