Artificial intelligence 模拟人生3人工智能:概率效用

Artificial intelligence 模拟人生3人工智能:概率效用,artificial-intelligence,probability,utility,Artificial Intelligence,Probability,Utility,Richard Evans在GDC 2010上介绍了模拟人生3 AI。他在演示幻灯片上详细描述了算法: 在幻灯片36中,他描述了他们如何将效用分数转换为概率分布,人工智能使用概率分布随机选择要采取的行动 有人能解释一下概率分布是如何计算的吗?我尝试使用简化的波尔兹曼方程计算幻灯片36上显示的概率,并根据左侧图表和幻灯片38中的“温度”估算效用分数,但是,我无法得到与幻灯片36右侧所示图表类似的结果。一组效用指标的概率分布只是计算任何效用在整体上所占的百分比 例:吃=10,睡=100,猎=20

Richard Evans在GDC 2010上介绍了模拟人生3 AI。他在演示幻灯片上详细描述了算法:

在幻灯片36中,他描述了他们如何将效用分数转换为概率分布,人工智能使用概率分布随机选择要采取的行动


有人能解释一下概率分布是如何计算的吗?我尝试使用简化的波尔兹曼方程计算幻灯片36上显示的概率,并根据左侧图表和幻灯片38中的“温度”估算效用分数,但是,我无法得到与幻灯片36右侧所示图表类似的结果。

一组效用指标的概率分布只是计算任何效用在整体上所占的百分比

例:吃=10,睡=100,猎=20

你吃东西的概率是10/130。或0.0769。或7.7%。
睡眠率为76.9%。 亨特为15.4%

你让代理人通过掷骰子和落入这三个桶中的一个来决定做什么。可能是睡觉。这就是您满足的方式:

"Choose randomly using the score distribution as the probability distribution"

至于他的幻灯片和他的“简化玻尔兹曼方程”。他加入了另一个变量和步骤,这并没有被真正描述。显然这与压力有关。但是你不能把左边的图表转换成右边的图表,因为你没有所有需要的信息。因为这都是胡说八道。是Sims dude,你认为它有多深?

幻灯片中使用的方程式似乎不是简化版,而是改进版

但是,为了使其成为有效概率,需要进一步修改,因为所有概率都应在[0,1]范围内,而幻灯片中给出的概率公式可以计算为<0和>1,这没有任何意义。正确的公式应为:

pi=最大值(esi/T-1,0)/Z

其中Z定义为

Z=最大值(es1/T-1,0)+最大值(es2/T-1,0)+…+最大值(esN/T-1,0)


si和pi分别是分数(效用?)和第i个动作的概率。N是可能的操作数。

你应该描述他描述的内容。没有人愿意跟随你的链接。