Artificial intelligence 人工智能:如果有“a”这样的东西;“顺序决策”;任务,a是什么;“非顺序决策”;任务看起来像什么?

Artificial intelligence 人工智能:如果有“a”这样的东西;“顺序决策”;任务,a是什么;“非顺序决策”;任务看起来像什么?,artificial-intelligence,sequential,nonsequential,Artificial Intelligence,Sequential,Nonsequential,我听说神经网络在执行顺序决策任务的解决方案时非常好。但是,我假设存在限定符“sequential”,因为同样必须存在一个“non-sequential”域。只是想知道是否有一些标准的,规范的例子,有些人知道他们的头顶。谢谢:)认出了你母亲的照片。决定早餐吃什么。想出非连续性决策任务的例子。识别你母亲的照片。决定早餐吃什么。提出非连续性决策任务的例子。驾驶是连续性任务的一个很好的例子:你总是在决定是直行、左行还是右行。它是连续的,因为车辆中存在一些不确定性;你可以直接驾驶,但车子稍微向右偏了一点。

我听说神经网络在执行顺序决策任务的解决方案时非常好。但是,我假设存在限定符“sequential”,因为同样必须存在一个“non-sequential”域。只是想知道是否有一些标准的,规范的例子,有些人知道他们的头顶。谢谢:)

认出了你母亲的照片。决定早餐吃什么。想出非连续性决策任务的例子。

识别你母亲的照片。决定早餐吃什么。提出非连续性决策任务的例子。

驾驶是连续性任务的一个很好的例子:你总是在决定是直行、左行还是右行。它是连续的,因为车辆中存在一些不确定性;你可以直接驾驶,但车子稍微向右偏了一点。当你注意到这一点时,你可以通过稍微向左转向来纠正。没有办法提前做出所有决定,闭上眼睛,开车时不撞车

规划从a到B的路径是非顺序任务的一个示例(例如,谷歌地图)。你知道地图,你知道起点和目标,你知道道路网。您可以一次做出所有决策(而不是按顺序),并完成任务(查找路径)


更一般地说,只要你有不确定性,观察到一些事情,然后做出适当的反应,你就会做出连续的决定。从机器学习的角度来看,这就是监督学习和在线学习之间的区别。

驾驶是顺序任务的一个很好的例子:你总是在决定是直行、左行还是右行。它是连续的,因为车辆中存在一些不确定性;你可以直接驾驶,但车子稍微向右偏了一点。当你注意到这一点时,你可以通过稍微向左转向来纠正。没有办法提前做出所有决定,闭上眼睛,开车时不撞车

规划从a到B的路径是非顺序任务的一个示例(例如,谷歌地图)。你知道地图,你知道起点和目标,你知道道路网。您可以一次做出所有决策(而不是按顺序),并完成任务(查找路径)


更一般地说,只要你有不确定性,观察到一些事情,然后做出适当的反应,你就会做出连续的决定。从机器学习的角度来看,这就是监督学习和在线学习之间的区别。

决定早餐吃什么?这似乎很有顺序?我不知道这怎么会变成一个非连续的任务?想想你是如何决定早餐吃什么的。然后看看你是否能把它们作为一系列步骤写出来。当然,它可以以一种循序渐进的方式(你所拥有的每一种食物的速度,确定你可以制作的所有食谱,对每一种配方的难度和质量进行评分,考虑配方项目的所有组合,看看哪些适合于合理的早餐),但没有人真正决定这种方式。但是当神经网络或计算机完成时,他们不是必须按顺序计算所有事情吗,不管它被认为是连续的还是非连续的决策?是否有一个标准的顺序决策示例可以与我们的非顺序示例进行比较?理论上,原则上应该可以将任何非顺序方法映射到顺序方法,反之亦然。那么,您是否可以说一个神经网络(对应于游戏中的一个代理)将传感器数据输入其输入神经元,和每个输出神经元对应的某些动作,一个非序列模型?我很困惑,因为这看起来是这样的,但我总是听到人们在提到“顺序”决策任务时使用的例子……决定早餐吃什么?这似乎很有顺序?我不知道这怎么会变成一个非连续的任务?想想你是如何决定早餐吃什么的。然后看看你是否能把它们作为一系列步骤写出来。当然,它可以以一种循序渐进的方式(你所拥有的每一种食物的速度,确定你可以制作的所有食谱,对每一种配方的难度和质量进行评分,考虑配方项目的所有组合,看看哪些适合于合理的早餐),但没有人真正决定这种方式。但是当神经网络或计算机完成时,他们不是必须按顺序计算所有事情吗,不管它被认为是连续的还是非连续的决策?是否有一个标准的顺序决策示例可以与我们的非顺序示例进行比较?理论上,原则上应该可以将任何非顺序方法映射到顺序方法,反之亦然。那么,您是否可以说一个神经网络(对应于游戏中的一个代理)将传感器数据输入其输入神经元,和每个输出神经元对应的某些动作,一个非序列模型?我很困惑,因为这看起来是这样的,但我总是听到人们提到“顺序”决策任务时使用的例子……“从机器学习的角度来看,这就是监督学习和在线学习之间的区别。”谢谢你!你能解释一下这两者之间的关系吗?:)监督学习:你现在有了所有的数据,并用它来训练一些回归者/分类器(你的“决策者”)。在线学习:你有少量的数据。您可以使用它来训练回归器/分类器,并做出预测/决策。然后,您将收到更多数据,并更新您的决策者。这个过程重复。“从机器学习的角度来看,这就是监督学习和在线学习之间的区别。”谢谢你!你能解释一下这两者之间的关系吗?:)监督学习:您现在拥有所有数据,我们