Artificial intelligence 模拟人生3人工智能：概率效用_Artificial Intelligence_Probability_Utility

Artificial intelligence 模拟人生3人工智能：概率效用

artificial-intelligence

Artificial intelligence 模拟人生3人工智能：概率效用,artificial-intelligence,probability,utility,Artificial Intelligence,Probability,Utility,Richard Evans在GDC 2010上介绍了模拟人生3 AI。他在演示幻灯片上详细描述了算法：在幻灯片36中，他描述了他们如何将效用分数转换为概率分布，人工智能使用概率分布随机选择要采取的行动有人能解释一下概率分布是如何计算的吗？我尝试使用简化的波尔兹曼方程计算幻灯片36上显示的概率，并根据左侧图表和幻灯片38中的“温度”估算效用分数，但是，我无法得到与幻灯片36右侧所示图表类似的结果。一组效用指标的概率分布只是计算任何效用在整体上所占的百分比例：吃=10，睡=100，猎=20

Richard Evans在GDC 2010上介绍了模拟人生3 AI。他在演示幻灯片上详细描述了算法：

在幻灯片36中，他描述了他们如何将效用分数转换为概率分布，人工智能使用概率分布随机选择要采取的行动

有人能解释一下概率分布是如何计算的吗？我尝试使用简化的波尔兹曼方程计算幻灯片36上显示的概率，并根据左侧图表和幻灯片38中的“温度”估算效用分数，但是，我无法得到与幻灯片36右侧所示图表类似的结果。

一组效用指标的概率分布只是计算任何效用在整体上所占的百分比

例：吃=10，睡=100，猎=20

你吃东西的概率是10/130。或0.0769。或7.7%。
睡眠率为76.9%。亨特为15.4%

你让代理人通过掷骰子和落入这三个桶中的一个来决定做什么。可能是睡觉。这就是您满足的方式：

"Choose randomly using the score distribution as the probability distribution"

至于他的幻灯片和他的“简化玻尔兹曼方程”。他加入了另一个变量和步骤，这并没有被真正描述。显然这与压力有关。但是你不能把左边的图表转换成右边的图表，因为你没有所有需要的信息。因为这都是胡说八道。是Sims dude，你认为它有多深？

幻灯片中使用的方程式似乎不是简化版，而是改进版

但是，为了使其成为有效概率，需要进一步修改，因为所有概率都应在[0,1]范围内，而幻灯片中给出的概率公式可以计算为<0和>1，这没有任何意义。正确的公式应为：

pi=最大值（esi/T-1,0）/Z

其中Z定义为

Z=最大值（es1/T-1，0）+最大值（es2/T-1，0）+…+最大值（esN/T-1，0）

si和pi分别是分数（效用？）和第i个动作的概率。N是可能的操作数。

你应该描述他描述的内容。没有人愿意跟随你的链接。