Arrays 向量搜索算法

Arrays 向量搜索算法,arrays,algorithm,r,Arrays,Algorithm,R,我有以下问题。假设我有一个向量: v = [1,2,3,4,5,1,2,3,4,...] 我想从向量中顺序采样点,这些点的绝对magnute差值高于先前采样点的阈值。假设我的阈值是2 我从索引1开始,对第一个点1进行采样。然后我的条件在v[3]处满足,我的样本是3(因为3-1>=2)。然后3,新的采样点成为参考点,我检查它。下一个采样点为5,即v[5](5-3>=2)。然后下一个点是1,它是v[6](abs(1-5)>=2) 不幸的是,我在R中的代码太长了。基本上,我是在重复扫描阵列并寻找匹配

我有以下问题。假设我有一个向量:

v = [1,2,3,4,5,1,2,3,4,...]
我想从向量中顺序采样点,这些点的绝对magnute差值高于先前采样点的阈值。假设我的阈值是2

我从索引1开始,对第一个点1进行采样。然后我的条件在v[3]处满足,我的样本是3(因为3-1>=2)。然后3,新的采样点成为参考点,我检查它。下一个采样点为5,即v[5](5-3>=2)。然后下一个点是1,它是v[6](abs(1-5)>=2)

不幸的是,我在R中的代码太长了。基本上,我是在重复扫描阵列并寻找匹配项。我认为这种方法是幼稚的。我有一种感觉,我可以通过阵列一次完成这项任务。我不知道怎么做。谢谢你的帮助。我想我遇到的问题是,下一个采样点的位置可以在阵列中的任何位置,我需要从当前点扫描阵列到最后找到它


谢谢。

我不认为没有循环就可以做到这一点,所以这里有一个:

my.sample <- function(x, thresh) {
   out <- x
   i <- 1
   for (j in seq_along(x)[-1]) {
      if (abs(x[i]-x[j]) >= thresh) {
         i <- j
      } else {
         out[j] <- NA
      }
   }
   out[!is.na(out)]
}

my.sample(x = c(1:5,1:4), thresh = 2)
# [1] 1 3 5 1 3

my.sample您可以在不使用循环的情况下使用一点递归来执行此操作:

vsearch = function(v, x, fun=NULL) {
  # v: input vector
  # x: threshold level

  if (!length(v) > 0) return(NULL)

  y = v-rep(v[1], times=length(v))
  if (!is.null(fun)) y = fun(y)

  i = which(y >= x)

  if (!length(i) > 0) return(NULL)
  i = i[1]

  return(c(v[i], vsearch(v[-(1:(i-1))], x, fun=fun)))
}
使用上面的向量:

> vsearch(c(1,2,3,4,5,1,2,3,4), 2, abs)
[1] 3 5 1 3

我认为可能有一种方法使用
outer
其中(…,arr.ind=TRUE)
。可能,但从复杂性的角度来看,我的算法是线性的,而
outer
是O(n^2)。我可以想象一个有效编码的O(n^2)算法充分利用了R(矢量化等)可能比我的更快,但不会随着
n
变得更大。