R 使用data.table对多列执行滚动自定义计算

R 使用data.table对多列执行滚动自定义计算,r,data.table,lead,R,Data.table,Lead,我正在使用下面的代码对一列进行滚动计算 dt <- data.table(x1=1:8,x2=2:10,x3=4:11,x4=6:12) N = 3L dt[, y1 := (2*dt$x1[.I] -dt$x1[(.I+N-1L)]), by=1:nrow(dt)] dt x1 x2 x3 x4 y1 1: 1 2 4 6 -1 2: 2 3 5 7 0 3: 3 4 6 8 1 4: 4 5 7 9 2 5: 5 6 8 10

我正在使用下面的代码对一列进行滚动计算

dt <- data.table(x1=1:8,x2=2:10,x3=4:11,x4=6:12)
N = 3L
dt[, y1 := (2*dt$x1[.I] -dt$x1[(.I+N-1L)]), by=1:nrow(dt)]
dt


     x1 x2 x3 x4 y1
1:  1  2  4  6 -1
2:  2  3  5  7  0
3:  3  4  6  8  1
4:  4  5  7  9  2
5:  5  6  8 10  3
6:  6  7  9 11  4
7:  7  8 10 12 13
8:  8  9 11  6 NA
9:  1 10  4  7 NA

sdcols=paste0("x",1:4) 

dt也许我们不需要手术分组

nm1 <- names(dt)
dt[,  paste0('y', seq_along(nm1)) := lapply(.SD, 
    function(x) c((2*shift(x)- shift(x, type = 'lead'))[-1], NA)), .SDcols = nm1]
dt
#   x1 x2 x3 x4 y1 y2 y3 y4
#1:  1  2  4  6 -1  0  2  4
#2:  2  3  5  7  0  1  3  5
#3:  3  4  6  8  1  2  4  6
#4:  4  5  7  9  2  3  5  7
#5:  5  6  8 10  3  4  6  8
#6:  6  7  9 11  4  5  7 16
#7:  7  8 10 12 13  6 16 17
#8:  8  9 11  6 NA NA NA NA
#9:  1 10  4  7 NA NA NA NA

nm1该解决方案有效且优雅。我在解码这段代码c时遇到困难((2*shift(x)-shift(x,type='lead'))[-1],NA))。为什么使用c,为什么使用[-1],为什么使用NA?你能帮我澄清一下吗?@ashleych我用它来删除第一个观察值,然后在最后附加NA以获得预期输出。我真的不知道这将如何转化为OP变量的其他值
N=3
@Frank我没有用其他值测试它,除了提供的示例中的值