Machine learning 学习估计值和期望时差误差

Machine learning 学习估计值和期望时差误差,machine-learning,reinforcement-learning,temporal-difference,Machine Learning,Reinforcement Learning,Temporal Difference,我如何才能最好地让我的人际网络不仅了解预期值,而且了解该值周围的预期变化,这是一种不确定性度量。对于网络从未见过的任何状态,这将是非常高的,对于网络多次见过的任何状态,它应该接近预期变化的某种估计 想知道是否可以通过一个(可能部分)重叠的网络同时“学习”这两个方面

我如何才能最好地让我的人际网络不仅了解预期值,而且了解该值周围的预期变化,这是一种不确定性度量。对于网络从未见过的任何状态,这将是非常高的,对于网络多次见过的任何状态,它应该接近预期变化的某种估计

想知道是否可以通过一个(可能部分)重叠的网络同时“学习”这两个方面