Arrays 向量搜索算法_Arrays_Algorithm_R

Arrays 向量搜索算法

arrays algorithm r

Arrays 向量搜索算法,arrays,algorithm,r,Arrays,Algorithm,R,我有以下问题。假设我有一个向量： v = [1,2,3,4,5,1,2,3,4,...] 我想从向量中顺序采样点，这些点的绝对magnute差值高于先前采样点的阈值。假设我的阈值是2 我从索引1开始，对第一个点1进行采样。然后我的条件在v[3]处满足，我的样本是3（因为3-1>=2）。然后3，新的采样点成为参考点，我检查它。下一个采样点为5，即v[5]（5-3>=2）。然后下一个点是1，它是v[6]（abs（1-5）>=2）不幸的是，我在R中的代码太长了。基本上，我是在重复扫描阵列并寻找匹配

我有以下问题。假设我有一个向量：

v = [1,2,3,4,5,1,2,3,4,...]

我想从向量中顺序采样点，这些点的绝对magnute差值高于先前采样点的阈值。假设我的阈值是2

我从索引1开始，对第一个点1进行采样。然后我的条件在v[3]处满足，我的样本是3（因为3-1>=2）。然后3，新的采样点成为参考点，我检查它。下一个采样点为5，即v[5]（5-3>=2）。然后下一个点是1，它是v[6]（abs（1-5）>=2）

不幸的是，我在R中的代码太长了。基本上，我是在重复扫描阵列并寻找匹配项。我认为这种方法是幼稚的。我有一种感觉，我可以通过阵列一次完成这项任务。我不知道怎么做。谢谢你的帮助。我想我遇到的问题是，下一个采样点的位置可以在阵列中的任何位置，我需要从当前点扫描阵列到最后找到它

谢谢。

我不认为没有循环就可以做到这一点，所以这里有一个：

my.sample <- function(x, thresh) {
   out <- x
   i <- 1
   for (j in seq_along(x)[-1]) {
      if (abs(x[i]-x[j]) >= thresh) {
         i <- j
      } else {
         out[j] <- NA
      }
   }
   out[!is.na(out)]
}

my.sample(x = c(1:5,1:4), thresh = 2)
# [1] 1 3 5 1 3

my.sample您可以在不使用循环的情况下使用一点递归来执行此操作：
vsearch = function(v, x, fun=NULL) {
  # v: input vector
  # x: threshold level

  if (!length(v) > 0) return(NULL)

  y = v-rep(v[1], times=length(v))
  if (!is.null(fun)) y = fun(y)

  i = which(y >= x)

  if (!length(i) > 0) return(NULL)
  i = i[1]

  return(c(v[i], vsearch(v[-(1:(i-1))], x, fun=fun)))
}

使用上面的向量：
> vsearch(c(1,2,3,4,5,1,2,3,4), 2, abs)
[1] 3 5 1 3

我认为可能有一种方法使用outer
和其中（…，arr.ind=TRUE）
。可能，但从复杂性的角度来看，我的算法是线性的，而outer
是O（n^2）。我可以想象一个有效编码的O（n^2）算法充分利用了R（矢量化等）可能比我的更快，但不会随着n
变得更大。