Arrays 向量搜索算法
我有以下问题。假设我有一个向量:Arrays 向量搜索算法,arrays,algorithm,r,Arrays,Algorithm,R,我有以下问题。假设我有一个向量: v = [1,2,3,4,5,1,2,3,4,...] 我想从向量中顺序采样点,这些点的绝对magnute差值高于先前采样点的阈值。假设我的阈值是2 我从索引1开始,对第一个点1进行采样。然后我的条件在v[3]处满足,我的样本是3(因为3-1>=2)。然后3,新的采样点成为参考点,我检查它。下一个采样点为5,即v[5](5-3>=2)。然后下一个点是1,它是v[6](abs(1-5)>=2) 不幸的是,我在R中的代码太长了。基本上,我是在重复扫描阵列并寻找匹配
v = [1,2,3,4,5,1,2,3,4,...]
我想从向量中顺序采样点,这些点的绝对magnute差值高于先前采样点的阈值。假设我的阈值是2
我从索引1开始,对第一个点1进行采样。然后我的条件在v[3]处满足,我的样本是3(因为3-1>=2)。然后3,新的采样点成为参考点,我检查它。下一个采样点为5,即v[5](5-3>=2)。然后下一个点是1,它是v[6](abs(1-5)>=2)
不幸的是,我在R中的代码太长了。基本上,我是在重复扫描阵列并寻找匹配项。我认为这种方法是幼稚的。我有一种感觉,我可以通过阵列一次完成这项任务。我不知道怎么做。谢谢你的帮助。我想我遇到的问题是,下一个采样点的位置可以在阵列中的任何位置,我需要从当前点扫描阵列到最后找到它
谢谢。我不认为没有循环就可以做到这一点,所以这里有一个:
my.sample <- function(x, thresh) {
out <- x
i <- 1
for (j in seq_along(x)[-1]) {
if (abs(x[i]-x[j]) >= thresh) {
i <- j
} else {
out[j] <- NA
}
}
out[!is.na(out)]
}
my.sample(x = c(1:5,1:4), thresh = 2)
# [1] 1 3 5 1 3
my.sample您可以在不使用循环的情况下使用一点递归来执行此操作:
vsearch = function(v, x, fun=NULL) {
# v: input vector
# x: threshold level
if (!length(v) > 0) return(NULL)
y = v-rep(v[1], times=length(v))
if (!is.null(fun)) y = fun(y)
i = which(y >= x)
if (!length(i) > 0) return(NULL)
i = i[1]
return(c(v[i], vsearch(v[-(1:(i-1))], x, fun=fun)))
}
使用上面的向量:
> vsearch(c(1,2,3,4,5,1,2,3,4), 2, abs)
[1] 3 5 1 3
我认为可能有一种方法使用outer
和其中(…,arr.ind=TRUE)
。可能,但从复杂性的角度来看,我的算法是线性的,而outer
是O(n^2)。我可以想象一个有效编码的O(n^2)算法充分利用了R(矢量化等)可能比我的更快,但不会随着n
变得更大。