Language agnostic 订单发布神经网络?

Language agnostic 订单发布神经网络?,language-agnostic,machine-learning,neural-network,Language Agnostic,Machine Learning,Neural Network,我对编写某些使用机器学习的软件感兴趣,并根据外部数据执行某些操作 然而,我遇到了一个问题(这对我来说总是很有趣)—— 如何编写机器学习软件来发布订单或订单序列 问题是,据我所知,神经网络从输入中获取大量信息,并根据先前训练的结果“回忆”输出。立刻(好吧,或多或少)。所以我不确定“发布命令”如何适应这个系统,特别是当系统执行的操作以一定的延迟影响系统时。我也有点不确定如何训练这个东西 此类系统的示例: 1.第一人称射击敌方控制员。据我所知,可以为机器人实现神经网络控制器,根据一些输入(可能是健康、

我对编写某些使用机器学习的软件感兴趣,并根据外部数据执行某些操作

然而,我遇到了一个问题(这对我来说总是很有趣)—— 如何编写机器学习软件来发布订单或订单序列

问题是,据我所知,神经网络从输入中获取大量信息,并根据先前训练的结果“回忆”输出。立刻(好吧,或多或少)。所以我不确定“发布命令”如何适应这个系统,特别是当系统执行的操作以一定的延迟影响系统时。我也有点不确定如何训练这个东西

此类系统的示例:
1.第一人称射击敌方控制员。据我所知,可以为机器人实现神经网络控制器,根据一些输入(可能是健康、弹药等)切换机器人行为策略(好的,为它们分配优先级)。但我看不到一种制作高阶控制器的方法,这种控制器可以发出一系列命令,比如“去那里,然后左转”。此外,机器人的行为将影响控制机器人行为的变量。即射击会减少弹药,从高处坠落会降低生命值等。
2.自动市场交易者。当然,我们有可能建立一个系统来预测某物的下一个市场价格。然而,我不明白如何才能让系统发出购买订单,观察趋势,然后再将其卖出以获取利润/弥补损失。
3.汽车司机。同样,(据我所知)可以根据位置/速度/扭矩数据和先前训练的结果,使系统保持所需的运动矢量。然而,我没有看到一种方法可以让这样的系统(学会)执行一系列的动作

正如我所理解的,神经网络在技术上是一个矩阵——你给它输入,它产生输出。但如何生成可能改变程序运行环境的操作序列呢

如果这些任务不完全适用于神经网络,还可以使用什么

另外,我知道这个问题并不十分清楚,我怀疑我缺少一些知识。因此,我很欣赏一些指点(例如,要阅读的书籍/资源等)。

您可以尝试将输出神经元直接连接到控制器,例如,向前移动、转弯或在自我射手中射击,或为交易者购买订单。然而,我认为现在最好的结果是让神经网络解决一个相当具体的子问题,然后让一个“正常”的程序解释它的答案。例如,您可以让神经网络构建“我想去哪里”的地图覆盖,然后机器人将其转化为运动。交易者的神经网络可以产生一个“我想要多少哪张纸”,然后机器人将其转换为买卖订单

神经网络应解决的子问题是其设计的核心问题。重要的是,好的解决方案可以教给神经网络


编辑:在示例中对此进行扩展:当“自我射击者”机器人被射击时,它不应该希望出现在那里;当它射杀其他人的时候,它应该更想在那里。当交易者从一张纸上赔钱时,它应该在以前减少对它的需求;如果它赢了,它应该更想要它。这些东西是可以教的。

您描述的问题称为。强化学习本质上是一种与控制器耦合的机器学习算法(如神经网络)。它已用于您提到的所有应用程序,甚至是。

您不确定“发出订单”与系统输出的关系如何?@Anon:我不确定如何创建一个系统,该系统将学会按顺序发出订单,学会在特定条件下发出订单/延迟订单,订单可能会从根本上改变系统监视器的变量。此外,“订单”是即时的和离散的。也就是说,在AI射击机器人的情况下,“投掷手榴弹”是“离散”顺序,一旦投掷手榴弹,它就消失了。也就是说,我不知道如何制作一个系统,让它在试图实现某个目标的同时能够学会何时投掷手榴弹。你似乎已经将神经网络作为解决“问题”的方法(顺便说一句,你还没有详细阐述)。如果你只是为了好奇而想学习更多关于神经网络的知识,那么你最好从事更简单的任务并进行构建,而不是直接跳到“如何使用神经网络构建反击机器人?”。一些维基百科浏览者发现了这个教程:(),你可能会感兴趣。@Anon:我对机器学习很感兴趣,而不仅仅是神经网络。也就是说,我知道给定起始/结束车辆位置,可能会使用遗传算法“进化”车辆指令序列(制动/转弯等)。好吧,用同样的方法进化机器人的步态是可能的。问题是,如何使一个给定当前/所需汽车位置的系统能够动态生成指令序列——它不是神经网络,也不是遗传算法。据我所知,它相当接近于“制作一个可以学习如何下棋和赢得国际象棋的程序”…@Anon.:。。。幸运的是,斯万特举例说明了解决问题的不同方法(更准确地说,是不同的观点),这可能就足够了。有了“我有多想要”的想法,应该可以大大简化事情……“我想去哪里”、“我有多想要哪篇论文”:谢谢,这个想法一定会引导我走向有用的方向。