Machine learning 高斯进度回归用例_Machine Learning_Regression_Gaussian_Robotics_Non Linear Regression

Machine learning 高斯进度回归用例

machine-learning

Machine learning 高斯进度回归用例,machine-learning,regression,gaussian,robotics,non-linear-regression,Machine Learning,Regression,Gaussian,Robotics,Non Linear Regression,在阅读“基于触觉的主动物体识别和未知工作空间中的目标物体搜索”这篇论文时，有一点我无法理解：这篇论文是关于仅仅使用触觉信息来发现物体的位置和其他属性。在第4.1.2节中，作者说他使用GPR指导探索过程，在第4.1.4节中，他描述了他如何培训GPR：使用第4.1.2节中的示例，输入为（x，z），输出为y 只要存在触点，就会存储相应的y值此过程重复几次这个经过训练的探地雷达用于估计下一个勘探点，即方差最大的点在以下链接中，您还可以看到演示：。在视频的第一部分（0:24-0:29），第一次初

在阅读“基于触觉的主动物体识别和未知工作空间中的目标物体搜索”这篇论文时，有一点我无法理解：

这篇论文是关于仅仅使用触觉信息来发现物体的位置和其他属性。在第4.1.2节中，作者说他使用GPR指导探索过程，在第4.1.4节中，他描述了他如何培训GPR：

使用第4.1.2节中的示例，输入为（x，z），输出为y

只要存在触点，就会存储相应的y值

此过程重复几次

这个经过训练的探地雷达用于估计下一个勘探点，即方差最大的点

在以下链接中，您还可以看到演示：。在视频的第一部分（0:24-0:29），第一次初始化发生在机器人采样4次的地方。然后在接下来的25秒内，机器人从相应的方向探索。我不明白这个小小的探地雷达初始化是如何指导探索过程的。有人能解释一下如何估计第一个探索部分的输入点（x，z）吗？

任何回归算法都只是将输入

（x，z）

以特定算法特有的方式映射到输出

。对于新的输入

（x0，z0）

，如果训练中包含许多类似的数据点，则该算法可能会预测非常接近真实输出

y0

。如果只有在一个完全不同的地区才能获得训练数据，那么预测可能会非常糟糕

GPR包括预测置信度的度量，即方差。在以前没有看到过训练数据的区域，方差自然会非常高，而在非常接近已经看到的数据点的区域，方差会非常低。如果“实验”比评估高斯过程花费的时间要长得多，您可以使用高斯过程拟合来确保您对答案非常不确定的区域进行采样

如果目标是完全探索整个输入空间，则可以绘制大量

（x，z）

的随机值，并计算这些值的方差。然后，您可以在

中最不确定的输入点执行代价高昂的实验。然后，您可以使用到目前为止的所有探测数据对探地雷达进行重新训练，并重复该过程

针对优化问题（不是OP的问题）

如果您希望在整个输入空间中找到

的最低值，您对在已知的

值较高的区域进行实验不感兴趣，但您不确定这些值会有多高。因此，您可以选择

的预测值加上一个标准偏差，而不是选择方差最大的

（x，z）

点。这种最小化值的方法被称为贝叶斯优化，这种特定的方案被称为置信上限（UCB）。预期改善（EI）——改善以前最好成绩的概率——也常用。

如果我理解正确，本文中的方法利用了机器人在训练/探索阶段未出现的区域具有较高方差值的事实，并将机器人引导到这些区域。然后忽略最后一段的后半部分（参见编辑）。很抱歉，我问了一个额外的问题，但是如果我的目标是通过培训来检查环境，那该怎么办呢。因此，在训练后，我将有一个GPR模型，我用多个（x，z）点训练该模型，并对应于环境，估计训练标签（输出）y。之后我怎么能领导机器人呢？通过给出一个新的点（x1，z1），我可以用（y1-y）检查偏差，但我是否可以以某种更系统的方式使用方差进行检查？对于给定的新点

（x1，z1）

，您的GP将输出预期的方差。如果你以这种方式评估1000个随机点的方差，你可以选择在GP期望方差最大的点上进行实际实验（然后再训练，获得下一个点等）。方差是由GP预测的，因此您不必做额外的实验来估计它。不要混淆你的预测和实验结果之间的差异。在我在上面的评论中描述的情况下，GPR_1是在环境_1中训练的。在环境2中，我想测量这些环境有多不同。如果我用GPR_1计算点（x2，z2）与环境_2的方差，我可以自动测量这两个环境之间的差异。但例如，当我为下一个点（x2，z2）2重新训练GPR_1时，GPR_1将发生变化（我的参考环境模型发生变化）。或者这并不重要，因为我只是观察GPR_1和点（x2，z2）的最大方差。