Algorithm 部分可观测、无传感器环境示例

Algorithm 部分可观测、无传感器环境示例,algorithm,artificial-intelligence,observable,Algorithm,Artificial Intelligence,Observable,我目前正在研究《人工智能:现代方法》/斯图尔特·拉塞尔、彼得·诺维格中描述的部分可观测环境和无传感器问题。 第四章 我能在互联网上找到的部分可观察和无传感器问题的唯一例子是书中也提到的真空吸尘器问题 是否还有另一个例子,使其也可以执行上述算法 谢谢 侧扫您提到的这类问题在文献中称为“符合”规划(部分可观察,无反馈)问题。这不是一类非常“有趣”的规划问题,因为与更具表现力的模型(如偶然-部分可观察、部分反馈-规划)相比,对它们的研究很少 近年来,我们在这方面做了一些工作,您可以在这里查看Joerg

我目前正在研究《人工智能:现代方法》/斯图尔特·拉塞尔、彼得·诺维格中描述的部分可观测环境和无传感器问题。 第四章

我能在互联网上找到的部分可观察和无传感器问题的唯一例子是书中也提到的真空吸尘器问题

是否还有另一个例子,使其也可以执行上述算法

谢谢


侧扫

您提到的这类问题在文献中称为“符合”规划(部分可观察,无反馈)问题。这不是一类非常“有趣”的规划问题,因为与更具表现力的模型(如偶然-部分可观察、部分反馈-规划)相比,对它们的研究很少

近年来,我们在这方面做了一些工作,您可以在这里查看Joerg Hoffmann的基准测试:

一致规划的一种更有趣的“应用”是将设计有限状态控制器的问题映射为解决一致规划问题的问题。您可能需要检查这篇论文:

我认为有一些后续行动


请注意,在上面的章节中,问题被描述为表示初始状态下的不确定性的条状扩展。

您提到的问题在文献中被称为“一致”规划(部分可观察,无反馈)问题。这不是一类非常“有趣”的规划问题,因为与更具表现力的模型(如偶然-部分可观察、部分反馈-规划)相比,对它们的研究很少

近年来,我们在这方面做了一些工作,您可以在这里查看Joerg Hoffmann的基准测试:

一致规划的一种更有趣的“应用”是将设计有限状态控制器的问题映射为解决一致规划问题的问题。您可能需要检查这篇论文:

我认为有一些后续行动


请注意,上述问题以条带形式进行描述,以表示初始状态下的不确定性。

为什么不让我们对您自己的努力留下深刻印象,并邀请我们补充这些问题。这通常是一个比“请帮我思考”更好的方法。我的问题是,我所能想象的所有问题要么只是模仿真空吸尘器的例子,要么无法解决,要么不是很好地解决。例如,我想到了一个有两把锁的门,你可以锁和解锁(显然是一个简单的模仿)然后我想到了只启用动作交钥匙(和移动ofc),让你不知道门是否锁上了,这使得问题无法解决。我寻找了我知道的其他问题,如旅行推销员、食人族、女王和8字谜问题。最后一个eg不是可解的无传感器问题,但是用一个领域的知识以一种令人不安的方式解决,对于大多数其他领域,我看不到任何感官上的缺乏,使它成为一个无传感器的问题或部分可观察的问题。这不是一个特别有用或有趣的问题。在没有传感器的情况下,所有问题都是“部分可观察到的”,但只是在根本不可观察的琐碎意义上。R+N对于部分可观察到的问题有很多话要说,但大多是在有东西可观察的情况下。为什么不用你自己的努力给我们留下深刻印象,并邀请我们加入其中呢。这通常是一个比“请帮我思考”更好的方法。我的问题是,我所能想象的所有问题要么只是模仿真空吸尘器的例子,要么无法解决,要么不是很好地解决。例如,我想到了一个有两把锁的门,你可以锁和解锁(显然是一个简单的模仿)然后我想到了只启用动作交钥匙(和移动ofc),让你不知道门是否锁上了,这使得问题无法解决。我寻找了我知道的其他问题,如旅行推销员、食人族、女王和8字谜问题。最后一个eg不是可解的无传感器问题,但是用一个领域的知识以一种令人不安的方式解决,对于大多数其他领域,我看不到任何感官上的缺乏,使它成为一个无传感器的问题或部分可观察的问题。这不是一个特别有用或有趣的问题。在没有传感器的情况下,所有问题都是“部分可观察到的”,但只是在根本不可观察的琐碎意义上。对于部分可观察的问题,R+N有很多话要说,但主要是在有东西可观察的情况下。