Machine learning 用神经网络在线估计Q表

Machine learning 用神经网络在线估计Q表,machine-learning,neural-network,q-learning,Machine Learning,Neural Network,Q Learning,当我在强化学习中使用Q表来保存状态动作时,一些状态从未(或很少)发生,并且状态动作值在最大迭代之前保持为零,因此我决定使用神经网络在线估计Q表,而不是使用Q表 哪种类型的神经网络可以更准确地估计这类问题?这个解决方案对我有帮助吗?我使用局部加权回归(LWR)作为函数逼近 并简单地用此函数替换表

当我在强化学习中使用Q表来保存状态动作时,一些状态从未(或很少)发生,并且状态动作值在最大迭代之前保持为零,因此我决定使用神经网络在线估计Q表,而不是使用Q表


哪种类型的神经网络可以更准确地估计这类问题?这个解决方案对我有帮助吗?

我使用局部加权回归(LWR)作为函数逼近 并简单地用此函数替换表