Neural network 强化学习中神经网络的建立与监控_Neural Network_Artificial Intelligence_Reinforcement Learning

Neural network 强化学习中神经网络的建立与监控

neural-network artificial-intelligence

Neural network 强化学习中神经网络的建立与监控,neural-network,artificial-intelligence,reinforcement-learning,Neural Network,Artificial Intelligence,Reinforcement Learning,关于使用强化学习训练神经网络，我有几个问题，例如DQN： 1.在定义模型时，我们应该使用正则化器还是退出？ 2.在学习阶段，我们可以监控什么这个问题并没有一个普遍的答案。这实际上取决于您的环境和方法，最好的做法是测试有无，并比较结果您可以从监控网络损失和每集的一些环境性能指标开始（如果您的环境是某个游戏，您可以监控每集的分数）首先，感谢大家的关注。正规化怎么样？到目前为止，我看到的几乎每个例子都使用了NN，没有正则化和退出。我很好奇它是否有特殊的原因，原因可能是代理通常对环境有无限的访问权

关于使用强化学习训练神经网络，我有几个问题，例如DQN： 1.在定义模型时，我们应该使用正则化器还是退出？ 2.在学习阶段，我们可以监控什么

这个问题并没有一个普遍的答案。这实际上取决于您的环境和方法，最好的做法是测试有无，并比较结果

您可以从监控网络损失和每集的一些环境性能指标开始（如果您的环境是某个游戏，您可以监控每集的分数）

首先，感谢大家的关注。正规化怎么样？到目前为止，我看到的几乎每个例子都使用了NN，没有正则化和退出。我很好奇它是否有特殊的原因，原因可能是代理通常对环境有无限的访问权限，并且它可能有“无限”的数据，所以我们不必担心过度拟合。我不想详细回答你的问题，但请看一下这个答案