R 使用data.table对多列执行滚动自定义计算
我正在使用下面的代码对一列进行滚动计算R 使用data.table对多列执行滚动自定义计算,r,data.table,lead,R,Data.table,Lead,我正在使用下面的代码对一列进行滚动计算 dt <- data.table(x1=1:8,x2=2:10,x3=4:11,x4=6:12) N = 3L dt[, y1 := (2*dt$x1[.I] -dt$x1[(.I+N-1L)]), by=1:nrow(dt)] dt x1 x2 x3 x4 y1 1: 1 2 4 6 -1 2: 2 3 5 7 0 3: 3 4 6 8 1 4: 4 5 7 9 2 5: 5 6 8 10
dt <- data.table(x1=1:8,x2=2:10,x3=4:11,x4=6:12)
N = 3L
dt[, y1 := (2*dt$x1[.I] -dt$x1[(.I+N-1L)]), by=1:nrow(dt)]
dt
x1 x2 x3 x4 y1
1: 1 2 4 6 -1
2: 2 3 5 7 0
3: 3 4 6 8 1
4: 4 5 7 9 2
5: 5 6 8 10 3
6: 6 7 9 11 4
7: 7 8 10 12 13
8: 8 9 11 6 NA
9: 1 10 4 7 NA
sdcols=paste0("x",1:4)
dt也许我们不需要手术分组
nm1 <- names(dt)
dt[, paste0('y', seq_along(nm1)) := lapply(.SD,
function(x) c((2*shift(x)- shift(x, type = 'lead'))[-1], NA)), .SDcols = nm1]
dt
# x1 x2 x3 x4 y1 y2 y3 y4
#1: 1 2 4 6 -1 0 2 4
#2: 2 3 5 7 0 1 3 5
#3: 3 4 6 8 1 2 4 6
#4: 4 5 7 9 2 3 5 7
#5: 5 6 8 10 3 4 6 8
#6: 6 7 9 11 4 5 7 16
#7: 7 8 10 12 13 6 16 17
#8: 8 9 11 6 NA NA NA NA
#9: 1 10 4 7 NA NA NA NA
nm1该解决方案有效且优雅。我在解码这段代码c时遇到困难((2*shift(x)-shift(x,type='lead'))[-1],NA))。为什么使用c,为什么使用[-1],为什么使用NA?你能帮我澄清一下吗?@ashleych我用它来删除第一个观察值,然后在最后附加NA以获得预期输出。我真的不知道这将如何转化为OP变量的其他值N=3
@Frank我没有用其他值测试它,除了提供的示例中的值