Algorithm 将重叠区域分割为不相交区域_Algorithm_Intervals

Algorithm 将重叠区域分割为不相交区域

algorithm

Algorithm 将重叠区域分割为不相交区域,algorithm,intervals,Algorithm,Intervals,给定一组闭合区域[a，b]，其中a和b是整数，我需要找到另一组覆盖相同数字但不相交的区域我认为可以通过多次迭代集合来天真地完成，但我正在寻找一个好算法的建议。请帮忙编辑：为了澄清，结果区域不能大于原始区域，我必须提出原始区域包含的不相交区域。换句话说，我需要在它们重叠的边界上分割原始区域例如： 3,8 1,4 7,9 11,14 结果: 1,3 3,4 4,7 7,8 8,9 11,14 只需将所有端点从左向右排序（记住它们的类型：开始或结束）。从左到右键入。保持计数器从0开始。每当

给定一组闭合区域

[a，b]

，其中

和

是整数，我需要找到另一组覆盖相同数字但不相交的区域

我认为可以通过多次迭代集合来天真地完成，但我正在寻找一个好算法的建议。请帮忙

编辑：

为了澄清，结果区域不能大于原始区域，我必须提出原始区域包含的不相交区域。换句话说，我需要在它们重叠的边界上分割原始区域

例如：

3,8
1,4
7,9
11,14

结果:

1,3
3,4
4,7
7,8
8,9
11,14

只需将所有端点从左向右排序（记住它们的类型：开始或结束）。从左到右键入。保持计数器从0开始。每当你遇到一个开始：增加计数器。当遇到一个端点时：递减（请注意，计数器始终至少为0）

跟踪最后两点。如果计数器大于零-并且最后两个点不同（防止空范围）-添加最后两个点之间的间隔

伪代码：

points = all interval endpoints
sort(points)

previous = points[0]
counter = 1
for(int i = 1; i < #points; i++) {
    current = points[i]
    if (current was start point)
        counter++
    else
        counter--

    if (counter > 0 and previous != current)
        add (previous, current) to output

    previous = current
}

points=所有间隔端点
排序（点数）
上一个=点[0]
计数器=1
对于（int i=1；i<#点；i++）{
电流=点[i]
如果（当前为起始点）
柜台++
其他的
柜台--
如果（计数器>0和上一个！=当前）
将（上一个、当前）添加到输出
先前=当前
}

（这是对我今天早些时候发布的答案的修改，在发现它有逻辑错误后，我删除了它。后来我意识到我可以修改Vincent van der Weele使用括号深度修复错误的优雅想法）

编辑时：修改为能够接受长度为0的间隔

如果a未显示为长度大于0的任何间隔的端点，则调用长度为0的间隔[a，a]。例如，在[1,3]、[2,2]、[3,3]、[4,4]中，0长度间隔[2,2]和[4,4]是必要的，但[3,3]不是。不重要的0长度间隔是冗余的，因此不需要出现在最终输出中。初始扫描间隔列表时（加载基本数据结构），记录与0长度间隔对应的点，以及长度>0的间隔端点。扫描完成后，与基本0长度间隔相对应的每个点的两个实例将添加到端点列表中，然后对其进行排序。结果数据结构是一个多集，其中只有重复对应于基本的0长度间隔

对于间隔中的每个端点，将端点的pdelta（括号delta）定义为该点显示为左端点的次数减去显示为右端点的次数。将它们存储在端点键入的字典中

[a，b]其中a，b是端点列表的前两个元素，是不相交间隔列表中的第一个间隔。将b的括号深度定义为pdelta[a]和pdelta[b]之和。我们循环遍历其余端点，如下所示：

在循环的每个过程中，查看括号深度b。如果不为0，则还需要一个间隔的b。设a=b，新的p为列表中的下一个值。将括号深度调整为新b的pdelta，并将[a，b]添加到不相交间隔列表中。否则（如果b的括号深度为0），则让下一个[a，b]为列表中的下两个点，并相应地调整括号深度

下面是一个Python实现：

def disjointify(intervals):
    if len(intervals) == 0: return []
    pdelta = {}
    ends = set()
    disjoints = []
    onePoints = set() #onePoint intervals
    for (a,b) in intervals:
        if a == b:
            onePoints.add(a)
            if not a in pdelta: pdelta[a] = 0
        else:
            ends.add(a)
            ends.add(b)
            pdelta[a] = pdelta.setdefault(a,0) + 1
            pdelta[b] = pdelta.setdefault(b,0) - 1
    onePoints.difference_update(ends)
    ends = list(ends)
    for a in onePoints:
        ends.extend([a,a])
    ends.sort()
    a = ends[0]
    b = ends[1]
    pdepth = pdelta[a] + pdelta[b]
    i = 1
    disjoints.append((a,b))
    while i < len(ends) - 1:
        if pdepth != 0:
            a = b
            b = ends[i+1]
            pdepth += pdelta[b]
            i += 1
        else:
            a = ends[i+1]
            b = ends[i+2]
            pdepth += (pdelta[a] + pdelta[b])
            i += 2
        disjoints.append((a,b))
    return disjoints

（我使用Python元组来表示闭合区间，尽管它有一个小缺点，就是看起来像开放区间的标准数学符号）

最后一句话：将结果称为不相交区间的集合可能不准确，因为其中一些区间具有非空（尽管是1点）交点

Nice进近。我确实担心某些边缘情况。特别是——如果一个给定的端点出现不止一次，甚至可能出现多个开始和多个结束，该怎么办。您的算法可能会产生一些0长度的间隔。@VincentvanderWeele您的意思是

如果（前面是一个起点）

，对吗？@akonsu抱歉，不应该尝试在我的手机上写这些答案，很难保持概述；-）但不是，计数器表示当前位置有多少原始间隔。我的错误是，因为我从第二个点开始循环，所以我应该将计数器初始化为1（注意，我还假设总是有一个输入间隔…从这个意义上讲，算法不是很健壮，这只是总体思路）。谢谢！是的，我后来意识到我需要调整端点以消除这些1点重叠。这会在一个项目间隔上崩溃：

disjonify[（1,2），（3,3）]

你不能使用集合。我没有想到边缘情况——谢谢你指出。我修改了代码来处理它。我认为，在尽可能接近布景的情况下，仍有可能获得回报。给定端点可能在输入数据中出现很多次。在我修改过的版本中，我将端点存储在一个多集中，每个端点最多出现两次（精确地说是在它对应于一个非冗余的0长度间隔的情况下）。

>>> example = [(1,1), (1,4), (2,2), (4,4),(5,5), (6,8), (7,9), (10,10)]
>>> disjointify(example)
[(1, 2), (2, 2), (2, 4), (5, 5), (6, 7), (7, 8), (8, 9), (10, 10)]

>>> disjointify([(1,1), (2,2)])
[(1, 1), (2, 2)]