Algorithm 输入/输出活变量计算算法说明

Algorithm 输入/输出活变量计算算法说明,algorithm,graph-theory,control-flow-graph,Algorithm,Graph Theory,Control Flow Graph,显示了计算控制流图节点的输入[n]和输出[n]的算法。但我很难理解它是如何工作的。我看到了一些其他的变化,也很难理解它们。我以前从未处理过定点问题 for each n in[n] := {}; out[n] = {} repeat for each n in’[n] := in[n]; out’[n] := out[n] in[n] := use[n] ∪ (out[n] - def[n]) out[n] := ∪ {in[s] | s ε succ[n]}

显示了计算控制流图节点的输入[n]和输出[n]的算法。但我很难理解它是如何工作的。我看到了一些其他的变化,也很难理解它们。我以前从未处理过定点问题

for each n
  in[n] := {}; out[n] = {}
repeat
  for each n
    in’[n] := in[n]; out’[n] := out[n]
    in[n] := use[n] ∪ (out[n] - def[n])
    out[n] := ∪ {in[s] | s ε succ[n]}
  until in’[n] = in[n] and out’[n] = out[n]
  for all n 
问题是,这个算法在做什么/更直观地解释它。我不明白“入”和“出”是什么,也不明白“入”和“出”到底意味着什么。。。。不遵循嵌套循环。我对JavaScript实现的尝试显示了我缺少的部分:

var in = {}
var out = {}
var in2 = {}
var out2 = {}
var use = {}
var out = {}
var def = {}

for (var i = 0, n = nodes.length; i < n; i++) {
  var node = nodes[i]
  in[node] = []
  out[node] = []
  // assume these are already filled out:
  use[node] = []
  out[node] = []
  def[node] = []
}

while (true) {
  for (var i = 0, n = nodes.length; i < n; i++) {
    var node = nodes[i]
    in2[node] = in[node]
    out2[node] = out[node]
    // assume ∪ and - work on arrays
    in[node] = use[node] ∪ (out[node] - def[node])
    // ? not sure the ∪
    out[node] = ∪ {in[s] | s ε succ[n]}
  }

  // until in’[n] = in[n] and out’[n] = out[n]
  // for all n
}

任何帮助都将不胜感激。谢谢。

最小不动点算法适用于成员来自有限宇宙的集合数量有限的情况,并且每个集合的成员资格可能取决于其他集合的成员资格,特别是包括特定其他集合的元素

如果依赖项形成一个有向无环图DAG,则没有问题;可以通过对依赖关系上的集合进行拓扑排序,然后按顺序计算集合来计算集合。由于拓扑排序,没有一个集合依赖于前一个集合,因此在需要计算该集合时,其所有依赖项都已计算完毕

但是如果依赖图有圈,拓扑排序是不可能的,所以我们使用最小不动点算法。我们首先将所有集合设置为空,然后按一定顺序处理所有集合。当我们谈到一个依赖项时,我们只需添加在该依赖项中的元素。如果在此循环期间修改了任何集合,我们将再次处理所有集合。没有必要按相同的顺序处理它们,但这通常是最简单的方法。我们一次又一次地这样做,直到我们完成了一个完整的循环,没有向任何集合添加任何新元素。在这一点上,我们已经获得了一组一致的成员依赖关系,一个固定点,它没有额外的成员,所以它是最小的固定点

理论上,该算法可能需要很长时间,但它必须终止,因为每个周期都涉及固定数量的集合计算,并且除了最后一个周期外,至少向某个集合添加一个元素。在最坏的情况下,每个集合包含每个元素,因此可能只有有限个循环数,最多是集合数乘以元素数。在实践中,对于许多问题域,算法运行速度要快得多,或者集合和元素的乘积不是太大,或者两者都不是太大

这些问题通常可以通过计算关系方程的传递闭包来解决。由于传递闭包算法通常在理论复杂度和内环的实际执行时间方面都更快,因此如果速度重要,它们将是首选的解决方案。然而,最小不动点算法更容易理解,代码也不那么神秘

在确定活跃度的特定算法中,集合依赖关系列在上一张幻灯片上;您可以看到,每个输入和输出集都是由一些固定元素和一个或多个其他集的并集定义的。如图所示,该算法在循环开始时保存所有集合的副本,并在循环结束时将每个副本与其对应的集合进行比较。如果在循环过程中更改了任何集合,则算法尚未完成


在实践中,更常见的做法是在循环开始时将布尔标志设置为false,如果联合操作导致向集合中添加新元素,则将其设置为true。该集合很容易添加到联合操作中,但在正式算法中描述起来很混乱。如果循环结束时布尔值仍然为false,则算法终止。

Aha!这是关键,谢谢你如果在循环中有任何集合被更改,算法还没有完成。这是一个非常有用的解释。真棒:在实践中,更常见的是,在循环开始时将布尔标志设置为false,如果联合操作导致向集合中添加新元素,则将布尔标志设置为true。这也是关键的。如果依赖关系图有循环,则不可能进行拓扑排序,因此我们改为使用最小定点算法。似乎没有太多关于循环的内容,大部分内容都是关于DAG的。@lance:我所说的依赖关系图是由in[n]和out[n]的方程创建的,其中左侧依赖于右侧的所有内容。应该清楚的是,当它所表示的流有一个循环时,依赖关系图有一个循环,也就是说,几乎总是这样。