Machine learning AlphaGo零损失函数如何衡量MCTS概率和NN概率之间的相似性?

Machine learning AlphaGo零损失函数如何衡量MCTS概率和NN概率之间的相似性?,machine-learning,Machine Learning,如图所示,AlphaGo Zero神经网络使用损失函数,该函数使用MCTS概率和值作为基本真值标签。我试图了解神经网络的输出是否被视为logit(例如实值)或原始概率([0,1])。在损失函数中,MCTS概率(我确信位于[0,1])是向量乘以NN概率的对数。这是损失中的一个负项,但是这个项的大小表明了两个向量的相似性吗?为什么值越大表示相似性越大?正如所解释的,这是交叉熵损失的蒙特卡罗估计


如图所示,AlphaGo Zero神经网络使用损失函数,该函数使用MCTS概率和值作为基本真值标签。我试图了解神经网络的输出是否被视为logit(例如实值)或原始概率([0,1])。在损失函数中,MCTS概率(我确信位于[0,1])是向量乘以NN概率的对数。这是损失中的一个负项,但是这个项的大小表明了两个向量的相似性吗?为什么值越大表示相似性越大?

正如所解释的,这是交叉熵损失的蒙特卡罗估计