Python 在DqnAgent/tf_代理的上下文中,log_概率意味着什么

Python 在DqnAgent/tf_代理的上下文中,log_概率意味着什么,python,tensorflow2.0,tensorflow-agents,Python,Tensorflow2.0,Tensorflow Agents,在tf_代理中,构造函数中有一个名为emit_log_probabilities的参数,它对“策略是否发出日志概率”的解释非常没有帮助 在这种情况下,log_遗嘱认证实际上意味着什么?如果我启用它,它会给我一个标量值而不是向量,即使我有很多可能的动作,所以我不认为这是每个动作的概率。有关代理设置的完整代码示例,以及当emit\u log\u probability=True时发生的情况,请参见此

在tf_代理中,构造函数中有一个名为
emit_log_probabilities
的参数,它对“策略是否发出日志概率”的解释非常没有帮助

在这种情况下,log_遗嘱认证实际上意味着什么?如果我启用它,它会给我一个标量值而不是向量,即使我有很多可能的动作,所以我不认为这是每个动作的概率。有关代理设置的完整代码示例,以及当
emit\u log\u probability=True时发生的情况,请参见此