Python 在DqnAgent/tf_代理的上下文中,log_概率意味着什么
在tf_代理中,构造函数中有一个名为Python 在DqnAgent/tf_代理的上下文中,log_概率意味着什么,python,tensorflow2.0,tensorflow-agents,Python,Tensorflow2.0,Tensorflow Agents,在tf_代理中,构造函数中有一个名为emit_log_probabilities的参数,它对“策略是否发出日志概率”的解释非常没有帮助 在这种情况下,log_遗嘱认证实际上意味着什么?如果我启用它,它会给我一个标量值而不是向量,即使我有很多可能的动作,所以我不认为这是每个动作的概率。有关代理设置的完整代码示例,以及当emit\u log\u probability=True时发生的情况,请参见此
emit_log_probabilities
的参数,它对“策略是否发出日志概率”的解释非常没有帮助
在这种情况下,log_遗嘱认证实际上意味着什么?如果我启用它,它会给我一个标量值而不是向量,即使我有很多可能的动作,所以我不认为这是每个动作的概率。有关代理设置的完整代码示例,以及当emit\u log\u probability=True时发生的情况,请参见此