Machine learning 无法理解这一行流行的深度Q学习程序

Machine learning 无法理解这一行流行的深度Q学习程序,machine-learning,deep-learning,reinforcement-learning,Machine Learning,Deep Learning,Reinforcement Learning,我花了很多时间去理解它 为什么要使用tf.multiply 我找不到支持此乘法运算的数学。每个动作都有一个Q\u值。 而动作输入a是一个热点 所以这一行是选择“热”Q_值 我认为这个问题更适合我。

我花了很多时间去理解它

为什么要使用tf.multiply


我找不到支持此乘法运算的数学。

每个动作都有一个Q\u值。

而动作输入
a
是一个热点


所以这一行是选择“热”Q_值

我认为这个问题更适合我。