Algorithm 带间隙的最长递增子串
我遇到了如下指定的问题: 设A为正整数序列。Algorithm 带间隙的最长递增子串,algorithm,substring,lis,Algorithm,Substring,Lis,我遇到了如下指定的问题: 设A为正整数序列。 设B是a的子串。 设C为从a中删除B所创建的序列。 对于给定的A,求C的最长递增(严格)子串的长度,其中B可以任意选择 例如,设A=[3 2 5 7 1 2 8 1]。如果我们设置B=[12],那么C=[3 2 5 7 8 1],它的最长递增子串是[2 5 7 8],长度是4。4是答案,因为没有其他B会导致更好的解决方案 我找不到解决这个问题的算法(当然是在多项式时间内:),但我相信这将是最长递增子序列问题的某种变化。 请帮我找到一个好的算法,或者给
设B是a的子串。
设C为从a中删除B所创建的序列。
对于给定的A,求C的最长递增(严格)子串的长度,其中B可以任意选择 例如,设A=[3 2 5 7 1 2 8 1]。如果我们设置B=[12],那么C=[3 2 5 7 8 1],它的最长递增子串是[2 5 7 8],长度是4。4是答案,因为没有其他B会导致更好的解决方案 我找不到解决这个问题的算法(当然是在多项式时间内:),但我相信这将是最长递增子序列问题的某种变化。
请帮我找到一个好的算法,或者给我一些提示或参考。我对这个问题想得不多,但我认为这个
O(nlogn)
解决方案会奏效
对于A,维护数组,例如pref
和suff
pref[i]
包含可以从i
开始创建的最长递增子阵列(LIS)。类似地,suff[i]
包含您可以创建的LIS,其结尾为i
它们可以在O(n)
中创建
然后找到
(i,j)
的最佳组合,使suff[i]+pref[j]
最大,i制作两个长度为n
-noskip
和skip
的辅助数组
元素noskip[i]
包含以i
结尾的最长递增子字符串的长度,而不从原始字符串中删除任何内容。在O(n)中的算法的第一个过程中计算此数组
元素>代码>跳过[i] < /代码>包含在<代码> i结尾的最长增长子串的长度,中间有一个组的跳过。在第二次运行算法时,通过查看O(n2)中的
noskip
值来计算此数组
skip
数组的最大值就是问题的答案
以下是两个数组如何查找您的输入:
data: 3 2 5 7 1 2 8 1
noskip: 1 1 2 3 1 2 3 1
skip: 1 1 2 3 1 2 4 1
当我们查看8
时,我们会反复查看数据
,寻找这样的元素:j
,data[j]
,以及noskip[j]+1>跳过[i]
。如果data[i]>data[i]
,则skip[i]
的初始值设置为skip[i-1]
,否则设置为1
以下是Java中的示例实现:
int[] data = new int[] {3, 2, 5, 7, 1, 2, 8, 1};
int[] noskip = new int[data.length];
int[] skip = new int[data.length];
noskip[0] = 1;
for (int i = 1 ; i != skip.length ; i++) {
noskip[i] = data[i] > data[i-1] ? noskip[i-1]+1 : 1;
}
skip[0] = 1;
int res = 1;
for (int i = 1 ; i != data.length ; i++) {
skip[i] = data[i] > data[i-1] ? skip[i-1]+1 : 1;
for (int j = i-1 ; j >= 0 ; j--) {
if (data[j] < data[i] && noskip[j]+1 > skip[i]) {
skip[i] = noskip[j]+1;
}
}
res = Math.max(res, skip[i]);
}
System.out.println(res);
int[]data=newint[]{3,2,5,7,1,2,8,1};
int[]noskip=newint[data.length];
int[]skip=newint[data.length];
noskip[0]=1;
for(int i=1;i!=skip.length;i++){
noskip[i]=数据[i]>数据[i-1]?noskip[i-1]+1:1;
}
跳过[0]=1;
int res=1;
for(int i=1;i!=data.length;i++){
跳过[i]=数据[i]>数据[i-1]?跳过[i-1]+1:1;
对于(int j=i-1;j>=0;j--){
if(数据[j]跳过[i]){
skip[i]=noskip[j]+1;
}
}
res=Math.max(res,skip[i]);
}
系统输出打印项次(res);
在输入数组中执行单个迭代时:
- 设置一个数组
最小[n]
,其中最小[i]
表示长度为i
的递增子串可以结束的最小元素(例如if最小[3]=5,这意味着有一个长度为3的子串以5
结尾,没有长度为3的子串以4
结尾,否则最小的[3]
将是4
)
我们可以跟踪到目前为止最长的子串i
,如果该元素大于当前元素,只需替换最小的[i]
关于此数组的一个重要注意事项:此数组中的元素将严格按递增顺序排列,也就是说,如果数组中存在长度为i
以元素x
结尾的子字符串,则不再有包含等于或小于x
的元素的子字符串(这是因为较长的子字符串将包含长度为i
的子字符串,其结尾元素小于x
,因此最小的[i]
将是该元素,而不是x
)
- 除了这个数组,还要保留一个二进制搜索树(BST),它将元素映射到子字符串长度(基本上与数组相反)
更新
最小值时
,同时从BST中删除旧元素并插入新元素
(到目前为止,所有这些都是关于原始数组A中的子字符串,而不是移除后的数组C)
- 使用此方法,我们可以通过查找BST中小于该元素的最大元素并将该长度加1,找到C中以任何元素结尾的最长子字符串
longestSSAfterB
- C中以任何给定元素结尾的最长子字符串的最大值为1+以前一个元素结尾的最长子字符串(如果较小,则为0)和
longestsafterb
C中最长的子串就是我们在上面找到的最长的子串
所有这些都需要O(n log n)
例如:
A = [3 2 5 7 1 2 8 1]
BST.floor(i)+1
currentSS longestSSAfterB longestSSinC smallest BST
A[0]=3 1 0+1=1 max(1,0+1)=1 [3] [(3→1)]
A[1]=2 1 0+1=1 max(1,0+1)=1 [2] [(2→1)]
A[2]=5 2 (2→1)->1+1=2 max(2,1+1)=2 [2,5] [(2→1), (5→2)]
A[3]=7 3 (5→2)->2+1=3 max(3,2+1)=2 [2,5,7] [(2→1), (5→2), (7→3)]
A[4]=1 1 0+1=1 max(1,0+1)=1 [1,5,7] [(1→1), (5→2), (7→3)]
A[5]=2 2 (1→1)->1+1=2 max(2,1+1)=2 [1,2,7] [(1→1), (2→2), (7→3)]
A[6]=8 3 (7→3)->3+1=4 max(4,2+1)=4 [1,2,7] [(1→1), (2→2), (7→3)]
A[7]=1 1 0+1=1 max(1,0+1)=1 [1,5,7] [(1→1), (5→2), (7→3)]
Longest substring = max(longestSSinC) = 4
没有B会得到更好的解。或者你可以说B应该是空的,以获得最佳解。我认为你理解或提到的问题是错误的。@ShashwatKumar子串通常被认为是连续的,这确实会导致问题的最佳解,正如所述,可能涉及非空的B。多项式时间?你是否平均线性时间?你可以用蛮力求多项式时间(O(n^2)或O(n^3)的解。除非这实际上是关于子集(非连续)而不是子字符串,在这种情况下,它似乎与最长递增子序列问题相同。哦,对不起,我读错了。很难
A = [3 2 5 7 1 2 8 1]
BST.floor(i)+1
currentSS longestSSAfterB longestSSinC smallest BST
A[0]=3 1 0+1=1 max(1,0+1)=1 [3] [(3→1)]
A[1]=2 1 0+1=1 max(1,0+1)=1 [2] [(2→1)]
A[2]=5 2 (2→1)->1+1=2 max(2,1+1)=2 [2,5] [(2→1), (5→2)]
A[3]=7 3 (5→2)->2+1=3 max(3,2+1)=2 [2,5,7] [(2→1), (5→2), (7→3)]
A[4]=1 1 0+1=1 max(1,0+1)=1 [1,5,7] [(1→1), (5→2), (7→3)]
A[5]=2 2 (1→1)->1+1=2 max(2,1+1)=2 [1,2,7] [(1→1), (2→2), (7→3)]
A[6]=8 3 (7→3)->3+1=4 max(4,2+1)=4 [1,2,7] [(1→1), (2→2), (7→3)]
A[7]=1 1 0+1=1 max(1,0+1)=1 [1,5,7] [(1→1), (5→2), (7→3)]
Longest substring = max(longestSSinC) = 4