Machine learning AlphaGo零损失函数如何衡量MCTS概率和NN概率之间的相似性？_Machine Learning

Machine learning AlphaGo零损失函数如何衡量MCTS概率和NN概率之间的相似性？

machine-learning

Machine learning AlphaGo零损失函数如何衡量MCTS概率和NN概率之间的相似性？,machine-learning,Machine Learning,如图所示，AlphaGo Zero神经网络使用损失函数，该函数使用MCTS概率和值作为基本真值标签。我试图了解神经网络的输出是否被视为logit（例如实值）或原始概率（[0,1]）。在损失函数中，MCTS概率（我确信位于[0,1]）是向量乘以NN概率的对数。这是损失中的一个负项，但是这个项的大小表明了两个向量的相似性吗？为什么值越大表示相似性越大？正如所解释的，这是交叉熵损失的蒙特卡罗估计

如图所示，AlphaGo Zero神经网络使用损失函数，该函数使用MCTS概率和值作为基本真值标签。我试图了解神经网络的输出是否被视为logit（例如实值）或原始概率（[0,1]）。在损失函数中，MCTS概率（我确信位于[0,1]）是向量乘以NN概率的对数。这是损失中的一个负项，但是这个项的大小表明了两个向量的相似性吗？为什么值越大表示相似性越大？

正如所解释的，这是交叉熵损失的蒙特卡罗估计