R 按组查找运行最大值

R 按组查找运行最大值,r,max,groupwise-maximum,R,Max,Groupwise Maximum,我需要使用R按组查找变量的运行最大值。使用df[order(df$group,df$time),]按组内的时间对变量进行排序 我的变量有一些NA,但我可以通过在这个计算中将它们替换为零来处理它 这是数据帧df的外观: (df <- structure(list(var = c(5L, 2L, 3L, 4L, 0L, 3L, 6L, 4L, 8L, 4L), group = structure(c(1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L,

我需要使用R按组查找变量的运行最大值。使用
df[order(df$group,df$time),]
按组内的时间对变量进行排序

我的变量有一些NA,但我可以通过在这个计算中将它们替换为零来处理它

这是数据帧df的外观:

(df <- structure(list(var = c(5L, 2L, 3L, 4L, 0L, 3L, 6L, 4L, 8L, 4L),
               group = structure(c(1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L),
                                 .Label = c("a", "b"), class = "factor"),
               time = c(1L, 2L, 3L, 4L, 5L, 1L, 2L, 3L, 4L, 5L)),
          .Names = c("var", "group","time"),
          class = "data.frame", row.names = c(NA, -10L)))

#    var group time
# 1    5     a    1
# 2    2     a    2
# 3    3     a    3
# 4    4     a    4
# 5    0     a    5
# 6    3     b    1
# 7    6     b    2
# 8    4     b    3
# 9    8     b    4
# 10   4     b    5

如果您知道如何在R中实现它,请告诉我。

我们可以尝试
data.table
。将“data.frame”转换为“data.table”(
setDT(df1)
),按“group”分组,我们得到“var”的
cummax
,并将其分配给一个新变量(
:=

正如@Michael Chirico所评论的,如果数据不是按“时间”排序的,我们可以在“i”中这样做

setDT(df1)[order(time), curMax:=cummax(var), by = group]

或使用
dplyr

library(dplyr)
df1 %>% 
    group_by(group) %>%
    mutate(curMax = cummax(var)) 
如果
df1
tbl\u,则可能需要使用
arrange

df1 %>% 
    group_by(group) %>%
    arrange(time, .by_group=TRUE) %>%
    mutate(curMax = cummax(var)) 
dbplyr::window\u order

library(dbplyr)

df1 %>% 
    group_by(group) %>%
    window_order(time) %>%
    mutate(curMax = cummax(var)) 
您可以这样做:

df$curMax <- ave(df$var, df$group, FUN=cummax)

df$curMax只是一个稳健性检查:如果它不一定按
time
排序,您可以添加
setDT(df1)[order(time),curMax:=cummax(var),by=group]
找到这个问题的可能重复项。不过,它的答案不是很好:
library(dbplyr)

df1 %>% 
    group_by(group) %>%
    window_order(time) %>%
    mutate(curMax = cummax(var)) 
df$curMax <- ave(df$var, df$group, FUN=cummax)