Neural network 强化学习中神经网络的建立与监控

Neural network 强化学习中神经网络的建立与监控,neural-network,artificial-intelligence,reinforcement-learning,Neural Network,Artificial Intelligence,Reinforcement Learning,关于使用强化学习训练神经网络,我有几个问题,例如DQN: 1.在定义模型时,我们应该使用正则化器还是退出? 2.在学习阶段,我们可以监控什么 这个问题并没有一个普遍的答案。这实际上取决于您的环境和方法,最好的做法是测试有无,并比较结果 您可以从监控网络损失和每集的一些环境性能指标开始(如果您的环境是某个游戏,您可以监控每集的分数) 首先,感谢大家的关注。正规化怎么样?到目前为止,我看到的几乎每个例子都使用了NN,没有正则化和退出。我很好奇它是否有特殊的原因,原因可能是代理通常对环境有无限的访问权

关于使用强化学习训练神经网络,我有几个问题,例如DQN: 1.在定义模型时,我们应该使用正则化器还是退出? 2.在学习阶段,我们可以监控什么

  • 这个问题并没有一个普遍的答案。这实际上取决于您的环境和方法,最好的做法是测试有无,并比较结果
  • 您可以从监控网络损失和每集的一些环境性能指标开始(如果您的环境是某个游戏,您可以监控每集的分数)

  • 首先,感谢大家的关注。正规化怎么样?到目前为止,我看到的几乎每个例子都使用了NN,没有正则化和退出。我很好奇它是否有特殊的原因,原因可能是代理通常对环境有无限的访问权限,并且它可能有“无限”的数据,所以我们不必担心过度拟合。我不想详细回答你的问题,但请看一下这个答案