R 查找连续值序列中的最后一行
我正在处理一系列真假序列,这些序列是按组组织的,并延伸到一段时间(例如天)。下面,我花时间重新创建了一个示例,并使用R 查找连续值序列中的最后一行,r,aggregate,data.table,R,Aggregate,Data.table,我正在处理一系列真假序列,这些序列是按组组织的,并延伸到一段时间(例如天)。下面,我花时间重新创建了一个示例,并使用data.table包将data.frame转换为data.table > dput(df) structure(list(day = c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 1L, 2L, 3L, 4L, 5L, 6L, 7L), group = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L,
data.table
包将data.frame
转换为data.table
> dput(df)
structure(list(day = c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 1L, 2L, 3L,
4L, 5L, 6L, 7L), group = structure(c(1L, 1L, 1L, 1L, 1L, 1L,
1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), .Label = c("a", "b"), class = "factor"),
condition = structure(c(1L, 1L, 2L, 2L, 2L, 1L, 1L, 1L, 2L,
2L, 1L, 1L, 2L, 2L), .Label = c("FALSE", "TRUE"), class = "factor")), .Names = c("day",
"group", "condition"), row.names = c(NA, -14L), class = "data.frame")
> library(data.table)
> df <- as.data.table(df)
> setkey(df, group)
> df
day group condition
1: 1 a FALSE
2: 2 a FALSE
3: 3 a TRUE
4: 4 a TRUE
5: 5 a TRUE
6: 6 a FALSE
7: 7 a FALSE
8: 1 b FALSE
9: 2 b TRUE
10: 3 b TRUE
11: 4 b FALSE
12: 5 b FALSE
13: 6 b TRUE
14: 7 b TRUE
我想要完成的是一个最终输出,它标识每个组的第一个序列的最后一行,其中条件等于“TRUE”。请参阅下面我的输出:
group V1
1: a 5
2: b 3
> df
day group condition
1: 1 a FALSE
2: 2 a FALSE
3: 3 a TRUE
4: 4 a TRUE
5: 5 a TRUE <~~~~~
6: 6 a FALSE
7: 7 a FALSE
8: 1 b FALSE
9: 2 b TRUE
10: 3 b TRUE <~~~~~
11: 4 b FALSE
12: 5 b FALSE
13: 6 b TRUE
14: 7 b TRUE
V1组
1:a 5
2:B3
>df
日组条件
1:1错误
2:2 a错误
3:3 a真的吗
4:4 a真的吗
5:5a真这里我们可以寻找条件的变化,特别是从真到假的转变
a <- df[diff(c(condition,1)) == -1, day[1], by=group]
# group V1
# 1: a 5
# 2: b 3
a我已经修复/更新了我的代码,只提取了第一个。你又这么做了!非常感谢您抽出时间。我肯定需要更彻底地探索diff
函数!
a <- df[diff(c(condition,1)) == -1, day[1], by=group]
# group V1
# 1: a 5
# 2: b 3