Language agnostic 订单发布神经网络？_Language Agnostic_Machine Learning_Neural Network

Language agnostic 订单发布神经网络？

language-agnostic machine-learning neural-network

Language agnostic 订单发布神经网络？,language-agnostic,machine-learning,neural-network,Language Agnostic,Machine Learning,Neural Network,我对编写某些使用机器学习的软件感兴趣，并根据外部数据执行某些操作然而，我遇到了一个问题（这对我来说总是很有趣）—— 如何编写机器学习软件来发布订单或订单序列问题是，据我所知，神经网络从输入中获取大量信息，并根据先前训练的结果“回忆”输出。立刻（好吧，或多或少）。所以我不确定“发布命令”如何适应这个系统，特别是当系统执行的操作以一定的延迟影响系统时。我也有点不确定如何训练这个东西此类系统的示例： 1.第一人称射击敌方控制员。据我所知，可以为机器人实现神经网络控制器，根据一些输入（可能是健康、

我对编写某些使用机器学习的软件感兴趣，并根据外部数据执行某些操作

然而，我遇到了一个问题（这对我来说总是很有趣）—— 如何编写机器学习软件来发布订单或订单序列

问题是，据我所知，神经网络从输入中获取大量信息，并根据先前训练的结果“回忆”输出。立刻（好吧，或多或少）。所以我不确定“发布命令”如何适应这个系统，特别是当系统执行的操作以一定的延迟影响系统时。我也有点不确定如何训练这个东西

此类系统的示例：
1.第一人称射击敌方控制员。据我所知，可以为机器人实现神经网络控制器，根据一些输入（可能是健康、弹药等）切换机器人行为策略（好的，为它们分配优先级）。但我看不到一种制作高阶控制器的方法，这种控制器可以发出一系列命令，比如“去那里，然后左转”。此外，机器人的行为将影响控制机器人行为的变量。即射击会减少弹药，从高处坠落会降低生命值等。
2.自动市场交易者。当然，我们有可能建立一个系统来预测某物的下一个市场价格。然而，我不明白如何才能让系统发出购买订单，观察趋势，然后再将其卖出以获取利润/弥补损失。
3.汽车司机。同样，（据我所知）可以根据位置/速度/扭矩数据和先前训练的结果，使系统保持所需的运动矢量。然而，我没有看到一种方法可以让这样的系统（学会）执行一系列的动作

正如我所理解的，神经网络在技术上是一个矩阵——你给它输入，它产生输出。但如何生成可能改变程序运行环境的操作序列呢

如果这些任务不完全适用于神经网络，还可以使用什么

另外，我知道这个问题并不十分清楚，我怀疑我缺少一些知识。因此，我很欣赏一些指点（例如，要阅读的书籍/资源等）。

您可以尝试将输出神经元直接连接到控制器，例如，向前移动、转弯或在自我射手中射击，或为交易者购买订单。然而，我认为现在最好的结果是让神经网络解决一个相当具体的子问题，然后让一个“正常”的程序解释它的答案。例如，您可以让神经网络构建“我想去哪里”的地图覆盖，然后机器人将其转化为运动。交易者的神经网络可以产生一个“我想要多少哪张纸”，然后机器人将其转换为买卖订单

神经网络应解决的子问题是其设计的核心问题。重要的是，好的解决方案可以教给神经网络

编辑：在示例中对此进行扩展：当“自我射击者”机器人被射击时，它不应该希望出现在那里；当它射杀其他人的时候，它应该更想在那里。当交易者从一张纸上赔钱时，它应该在以前减少对它的需求；如果它赢了，它应该更想要它。这些东西是可以教的。

您描述的问题称为。强化学习本质上是一种与控制器耦合的机器学习算法（如神经网络）。它已用于您提到的所有应用程序，甚至是。

您不确定“发出订单”与系统输出的关系如何？@Anon:我不确定如何创建一个系统，该系统将学会按顺序发出订单，学会在特定条件下发出订单/延迟订单，订单可能会从根本上改变系统监视器的变量。此外，“订单”是即时的和离散的。也就是说，在AI射击机器人的情况下，“投掷手榴弹”是“离散”顺序，一旦投掷手榴弹，它就消失了。也就是说，我不知道如何制作一个系统，让它在试图实现某个目标的同时能够学会何时投掷手榴弹。你似乎已经将神经网络作为解决“问题”的方法（顺便说一句，你还没有详细阐述）。如果你只是为了好奇而想学习更多关于神经网络的知识，那么你最好从事更简单的任务并进行构建，而不是直接跳到“如何使用神经网络构建反击机器人？”。一些维基百科浏览者发现了这个教程：（），你可能会感兴趣。@Anon:我对机器学习很感兴趣，而不仅仅是神经网络。也就是说，我知道给定起始/结束车辆位置，可能会使用遗传算法“进化”车辆指令序列（制动/转弯等）。好吧，用同样的方法进化机器人的步态是可能的。问题是，如何使一个给定当前/所需汽车位置的系统能够动态生成指令序列——它不是神经网络，也不是遗传算法。据我所知，它相当接近于“制作一个可以学习如何下棋和赢得国际象棋的程序”…@Anon.：。。。幸运的是，斯万特举例说明了解决问题的不同方法（更准确地说，是不同的观点），这可能就足够了。有了“我有多想要”的想法，应该可以大大简化事情……“我想去哪里”、“我有多想要哪篇论文”：谢谢，这个想法一定会引导我走向有用的方向。