Algorithm 带间隙的最长递增子串

Algorithm 带间隙的最长递增子串,algorithm,substring,lis,Algorithm,Substring,Lis,我遇到了如下指定的问题: 设A为正整数序列。 设B是a的子串。 设C为从a中删除B所创建的序列。 对于给定的A,求C的最长递增(严格)子串的长度,其中B可以任意选择 例如,设A=[3 2 5 7 1 2 8 1]。如果我们设置B=[12],那么C=[3 2 5 7 8 1],它的最长递增子串是[2 5 7 8],长度是4。4是答案,因为没有其他B会导致更好的解决方案 我找不到解决这个问题的算法(当然是在多项式时间内:),但我相信这将是最长递增子序列问题的某种变化。 请帮我找到一个好的算法,或者给

我遇到了如下指定的问题:

设A为正整数序列。
设B是a的子串。
设C为从a中删除B所创建的序列。
对于给定的A,求C的最长递增(严格)子串的长度,其中B可以任意选择

例如,设A=[3 2 5 7 1 2 8 1]。如果我们设置B=[12],那么C=[3 2 5 7 8 1],它的最长递增子串是[2 5 7 8],长度是4。4是答案,因为没有其他B会导致更好的解决方案

我找不到解决这个问题的算法(当然是在多项式时间内:),但我相信这将是最长递增子序列问题的某种变化。

请帮我找到一个好的算法,或者给我一些提示或参考。

我对这个问题想得不多,但我认为这个
O(nlogn)
解决方案会奏效

对于A,维护数组,例如
pref
suff

pref[i]
包含可以从
i
开始创建的最长递增子阵列(LIS)。类似地,
suff[i]
包含您可以创建的LIS,其结尾为
i

它们可以在
O(n)
中创建


然后找到
(i,j)
的最佳组合,使
suff[i]+pref[j]
最大,
i制作两个长度为
n
-
noskip
skip
的辅助数组

元素
noskip[i]
包含以
i
结尾的最长递增子字符串的长度,而不从原始字符串中删除任何内容。在O(n)中的算法的第一个过程中计算此数组

元素>代码>跳过[i] < /代码>包含在<代码> i结尾的最长增长子串的长度,中间有一个组的跳过。在第二次运行算法时,通过查看O(n2)中的

noskip
值来计算此数组

skip
数组的最大值就是问题的答案

以下是两个数组如何查找您的输入:

data:   3 2 5 7 1 2 8 1
noskip: 1 1 2 3 1 2 3 1
skip:   1 1 2 3 1 2 4 1
当我们查看
8
时,我们会反复查看
数据
,寻找这样的元素:
j
data[j]
,以及
noskip[j]+1>跳过[i]
。如果
data[i]>data[i]
,则
skip[i]
的初始值设置为
skip[i-1]
,否则设置为
1

以下是Java中的示例实现:

int[] data = new int[] {3, 2, 5, 7, 1, 2, 8, 1};
int[] noskip = new int[data.length];
int[] skip = new int[data.length];
noskip[0] = 1;
for (int i = 1 ; i != skip.length ; i++) {
    noskip[i] = data[i] > data[i-1] ? noskip[i-1]+1 : 1;
}
skip[0] = 1;
int res = 1;
for (int i = 1 ; i != data.length ; i++) {
    skip[i] = data[i] > data[i-1] ? skip[i-1]+1 : 1;
    for (int j = i-1 ; j >= 0 ; j--) {
        if (data[j] < data[i] && noskip[j]+1 > skip[i]) {
            skip[i] = noskip[j]+1;
        }
    }
    res = Math.max(res, skip[i]);
}
System.out.println(res);
int[]data=newint[]{3,2,5,7,1,2,8,1};
int[]noskip=newint[data.length];
int[]skip=newint[data.length];
noskip[0]=1;
for(int i=1;i!=skip.length;i++){
noskip[i]=数据[i]>数据[i-1]?noskip[i-1]+1:1;
}
跳过[0]=1;
int res=1;
for(int i=1;i!=data.length;i++){
跳过[i]=数据[i]>数据[i-1]?跳过[i-1]+1:1;
对于(int j=i-1;j>=0;j--){
if(数据[j]跳过[i]){
skip[i]=noskip[j]+1;
}
}
res=Math.max(res,skip[i]);
}
系统输出打印项次(res);

在输入数组中执行单个迭代时:

  • 设置一个数组
    最小[n]
    ,其中
    最小[i]
    表示长度为
    i
    的递增子串可以结束的最小元素(例如if
    最小[3]=5,这意味着有一个长度为3的子串以
    5
    结尾,没有长度为3的子串以
    4
    结尾,否则
    最小的[3]
    将是
    4

    我们可以跟踪到目前为止最长的子串
    i
    ,如果该元素大于当前元素,只需替换
    最小的[i]

    关于此数组的一个重要注意事项:此数组中的元素将严格按递增顺序排列,也就是说,如果数组中存在长度为
    i
    以元素
    x
    结尾的子字符串,则不再有包含等于或小于
    x
    的元素的子字符串(这是因为较长的子字符串将包含长度为
    i
    的子字符串,其结尾元素小于
    x
    ,因此
    最小的[i]
    将是该元素,而不是
    x

  • 除了这个数组,还要保留一个二进制搜索树(BST),它将元素映射到子字符串长度(基本上与数组相反)

    更新
    最小值时
    ,同时从BST中删除旧元素并插入新元素

    (到目前为止,所有这些都是关于原始数组A中的子字符串,而不是移除后的数组C)

  • 使用此方法,我们可以通过查找BST中小于该元素的最大元素并将该长度加1,找到C中以任何元素结尾的最长子字符串
    longestSSAfterB

  • C中以任何给定元素结尾的最长子字符串的最大值为1+以前一个元素结尾的最长子字符串(如果较小,则为0)和
    longestsafterb

    C中最长的子串就是我们在上面找到的最长的子串

所有这些都需要
O(n log n)


例如:

A = [3 2 5 7 1 2 8 1]
                   BST.floor(i)+1
        currentSS  longestSSAfterB  longestSSinC  smallest BST
A[0]=3  1          0+1=1            max(1,0+1)=1  [3]      [(3→1)]
A[1]=2  1          0+1=1            max(1,0+1)=1  [2]      [(2→1)]
A[2]=5  2          (2→1)->1+1=2     max(2,1+1)=2  [2,5]    [(2→1), (5→2)]
A[3]=7  3          (5→2)->2+1=3     max(3,2+1)=2  [2,5,7]  [(2→1), (5→2), (7→3)]
A[4]=1  1          0+1=1            max(1,0+1)=1  [1,5,7]  [(1→1), (5→2), (7→3)]
A[5]=2  2          (1→1)->1+1=2     max(2,1+1)=2  [1,2,7]  [(1→1), (2→2), (7→3)]
A[6]=8  3          (7→3)->3+1=4     max(4,2+1)=4  [1,2,7]  [(1→1), (2→2), (7→3)]
A[7]=1  1          0+1=1            max(1,0+1)=1  [1,5,7]  [(1→1), (5→2), (7→3)]

Longest substring = max(longestSSinC) = 4

没有B会得到更好的解。或者你可以说B应该是空的,以获得最佳解。我认为你理解或提到的问题是错误的。@ShashwatKumar子串通常被认为是连续的,这确实会导致问题的最佳解,正如所述,可能涉及非空的B。多项式时间?你是否平均线性时间?你可以用蛮力求多项式时间(O(n^2)或O(n^3)的解。除非这实际上是关于子集(非连续)而不是子字符串,在这种情况下,它似乎与最长递增子序列问题相同。哦,对不起,我读错了。很难
A = [3 2 5 7 1 2 8 1]
                   BST.floor(i)+1
        currentSS  longestSSAfterB  longestSSinC  smallest BST
A[0]=3  1          0+1=1            max(1,0+1)=1  [3]      [(3→1)]
A[1]=2  1          0+1=1            max(1,0+1)=1  [2]      [(2→1)]
A[2]=5  2          (2→1)->1+1=2     max(2,1+1)=2  [2,5]    [(2→1), (5→2)]
A[3]=7  3          (5→2)->2+1=3     max(3,2+1)=2  [2,5,7]  [(2→1), (5→2), (7→3)]
A[4]=1  1          0+1=1            max(1,0+1)=1  [1,5,7]  [(1→1), (5→2), (7→3)]
A[5]=2  2          (1→1)->1+1=2     max(2,1+1)=2  [1,2,7]  [(1→1), (2→2), (7→3)]
A[6]=8  3          (7→3)->3+1=4     max(4,2+1)=4  [1,2,7]  [(1→1), (2→2), (7→3)]
A[7]=1  1          0+1=1            max(1,0+1)=1  [1,5,7]  [(1→1), (5→2), (7→3)]

Longest substring = max(longestSSinC) = 4