Algorithm 2人在棋盘上穿越随机网格的最优解

Algorithm 2人在棋盘上穿越随机网格的最优解,algorithm,Algorithm,考虑一个无限的二维电路板。我们有两名球员在板上的P1点和P2点。他们需要遍历电路板G1、G2、G3上的一系列方框。。。。格恩 开始时,只有G1是已知的。G2到Gn的坐标只有在穿过它前面的框之后才知道。玩家可以在单位时间内沿棋盘上8个可能的方向中的一个移动一个。我们需要找到最短的时间来使用两个玩家遍历所有需要的框 显而易见的解决方案是一种贪婪的方法,在这种方法中,需要穿越的盒子附近的玩家向盒子移动。然后我们再计算下一个G的较近球员。我觉得这个问题有一个更好的解决方案,我现在无法解决。是否存在更好的

考虑一个无限的二维电路板。我们有两名球员在板上的P1点和P2点。他们需要遍历电路板G1、G2、G3上的一系列方框。。。。格恩

开始时,只有G1是已知的。G2到Gn的坐标只有在穿过它前面的框之后才知道。玩家可以在单位时间内沿棋盘上8个可能的方向中的一个移动一个。我们需要找到最短的时间来使用两个玩家遍历所有需要的框


显而易见的解决方案是一种贪婪的方法,在这种方法中,需要穿越的盒子附近的玩家向盒子移动。然后我们再计算下一个G的较近球员。我觉得这个问题有一个更好的解决方案,我现在无法解决。是否存在更好的解决方案?

因为问题是不确定的,所以解决方案必须是启发式的

每个回合的“价格”是回合中的移动次数。这可以是PrN1或PrN2,分别表示N轮玩家1或玩家2的移动次数

每个回合的“得分”可以被认为是在移动后的某个安排(两名球员的位置)对其余回合是一个好的安排的概率

您可能希望使用一个同时考虑价格和分数的评估函数来做出决策

问题是,唯一有用的得分函数是球员之间距离的函数(距离越大,越有可能接近下一轮),这与最低价格完全同步。任何让玩家尽可能远离的选择都必须是最便宜的选择

如果最好的算法只是移动最近的玩家,这是你的第一本能,那么这意味着什么呢


如果棋盘不是无限的,你可以创建一个更好的计分函数,该函数考虑到下一个框的概率,这将降低将一名玩家留在棋盘边缘的安排的分数。

我认为,由于棋盘是无限的,我们应该尽可能在n个移动中用两名玩家覆盖尽可能多的区域(每n次)。这样,我们就可以在n次移动中最大限度地利用我们所能达到的丰富领域

因此,我的策略是:

下一个盒子旁边是谁

让这是P1


让P1进入方框(最短路径)然后让另一个玩家P2朝正相反的方向移动。这样我们可以最大化两个玩家之间的距离,从而最大限度地减少他们在n步中可以到达的区域的重叠。这样我们可以最大限度地扩大两个玩家在n步中可以到达的下一个方框的区域的覆盖范围。

选择离下一个方框最近的玩家这是你能找到的最好的启发

说明:每当出现一个新球门时,只有两种选择:以场地距离为代价将球员1或球员2移动到球门。我们也更喜欢球员相距较远而不是靠得很近的情况。最极端的情况是,两名球员都在同一个场地上,就像哈文一样g只有一个玩家。因为游戏场地是无限的,所以相距遥远总是更好的

如果这是正确的,那么你应该扪心自问:我真的应该选择距离球门较远的球员吗?如果我选择了另一名球员,球员之间的距离会比他们更近吗


当然不是。在一个无限的领域中,选择最接近的玩家有助于两者,最小化当前成本,改善下一个目标的情况(玩家相距很远).

如果G1的位置未知,那么你的贪婪方法是如何工作的?此外,如果之前访问过某个位置,如果该位置也是其中一个盒子所在的位置,那么这算不算?G1在开始时当然是已知的。不,你当然需要重新访问。你可以把它想象成一个蛇游戏,玩家需要收集食物随机位置的g。你没有明确地说,所以我会问。当P1到达G1时,P1和P2知道G2的位置?绘制Gi的概率分布是什么?它不可能是均匀的,因为这样Gi之间的预期距离将是无限的。Gi是独立于彼此而选择的吗e玩家的位置更准确地说,你不能在一个无限、离散的参数空间上定义一个均匀的分布。棋盘的长度是无限的。我猜得分是正确的,但如何得分和惩罚是我想不到的部分。@Sohaib-我错过了无限棋盘的要点。在这种情况下,“值”总是一样的-你不能比较两种安排。这意味着你只剩下“价格”,这就是你在问题本身中提出的。你的断言“球员之间的距离越大,越有可能接近下一个回合”不是真的。对于你能给出的每一个例子,玩家之间距离最大是一个好处,我可以给你一个让玩家更靠近的例子。@JimMischel-但这不是你衡量概率的方式。在描述的无限板中,下一个框可以在任何地方(所有单元格的概率都是一致的)在一个1D线上考虑一个变化:如果玩家在CP1和CP2上,最大化CP1和CP2之间的距离会减少下一个点的平均距离吗?(是的,确实如此)事情是在同一时间只有一个玩家可以移动。我在考虑这个策略,但我们如何证明这个策略是否更好?如果只有一个玩家可以移动,我会采取贪婪的方法。至于证明这个策略更好,我不知道。我会进行模拟,比较不同策略的结果。我不知道我不认为你是c