R 根据发生的情况保留值_R_Dataframe

R 根据发生的情况保留值

r dataframe

R 根据发生的情况保留值,r,dataframe,R,Dataframe,我有以下数据框df1。如何在连续出现6次w之后保存行值。例如，在id 1的情况下，w的最后一次出现在t8，因此，我想将出现在t7的值以及最后一个w在新数据帧中的位置保存下来。如果不满足条件，我想删除该行，例如ID3,4,5,6。输入： id t1 t2 t3 t4 t5 t6 t7 t6 t8 t9 1 w w w w w w t t w s 2 w w w w w w t t o s 3 w s s o w w t t

我有以下数据框

df1。

如何在连续出现6次

w之后保存行值。

例如，在

id 1的情况下，w
的最后一次出现在t8，
因此，我想将出现在t7
的值以及最后一个w
在新数据帧中的位置保存下来。如果不满足条件，我想删除该行，例如ID3,4,5,6。

输入：
  id t1 t2 t3 t4 t5 t6 t7 t6 t8 t9
  1  w  w  w  w  w  w  t  t  w  s
  2  w  w  w  w  w  w  t  t  o  s
  3  w  s  s  o  w  w  t  t  o  s
  4  w  s  s  o  o  w  t  t  o  s
  5  w  s  s  s  s  s  w  w  s  s
  6  s  s  s  w  t  t  w  w  w  s

输出：
  id t1 t2 t3 t4 t5 t6 t7 t6 t8 t9
  1                 w  t  t  w  s
  2                 w  t  t  o  s
  

样本数据
df1<-structure(list(id=c(1,2,3,4,5,6), t1=c("w","w","w","w","w","s"), t2=c("w","w","s","s","s","s"),t3 = c("w","w","s","s","s","s"),
                    t4 = c("w","w","o","o","s","w"), t5 = c("w","w","w","o","s","t"), t6 = c("w","w","w","w","s","t"),
                    t7 = c("t","t","t","t","w","w"),t6 = c("t","t","t","t","w","w"), t8 = c("w","o","o","o","s","w"), t9=c("s","s","s","s","s","s")), row.names = c(NA, 6L), class = "data.frame")

df1使用%
中的%和行和

df1[rowSums(t(apply(df1[2:7], 1, `%in%`, "w"))) == 6, -(2:6)]
#   id t6 t7 t8 t9 t10
# 1  1  w  t  t  w   s
# 2  2  w  t  t  o   s

编辑
或者使用rle
计数“w”
s，然后执行if/else
案例处理，如下所示：
res <- apply(df2, 1, function(x) {
  r <- rle(x)
  w <- which(r$lengths >= 6 & r$values == "w")
  if (length(w) == 0) NA
  else if (r$lengths[w] == 6)
    x[c(1, (w + 5):length(x))]
  else 
    x[1:w]
})
res[!is.na(res)]
# $`1`
# id  t6  t7  t8  t9 t10 
# "1" "w" "t" "t" "w" "s" 
# 
# $`6`
# id  t1  t2 
# "6" "s" "w" 

res
res <- apply(df2, 1, function(x) {
  r <- rle(x)
  w <- which(r$lengths >= 6 & r$values == "w")
  if (length(w) == 0) NA
  else if (r$lengths[w] == 6)
    x[c(1, (w + 5):length(x))]
  else 
    x[1:w]
})
res[!is.na(res)]
# $`1`
# id  t6  t7  t8  t9 t10 
# "1" "w" "t" "t" "w" "s" 
# 
# $`6`
# id  t1  t2 
# "6" "s" "w" 

df1 <- structure(list(id = c(1, 2, 3, 4, 5, 6), t1 = c("w", "w", "w", 
"w", "w", "s"), t2 = c("w", "w", "s", "s", "s", "s"), t3 = c("w", 
"w", "s", "s", "s", "s"), t4 = c("w", "w", "o", "o", "s", "w"
), t5 = c("w", "w", "w", "o", "s", "t"), t6 = c("w", "w", "w", 
"w", "s", "t"), t7 = c("t", "t", "t", "t", "w", "w"), t8 = c("t", 
"t", "t", "t", "w", "w"), t9 = c("w", "o", "o", "o", "s", "w"
), t10 = c("s", "s", "s", "s", "s", "s")), row.names = c(NA, 
6L), class = "data.frame")

df2 <- structure(list(id = c(1, 2, 3, 4, 5, 6), t1 = c("w", "w", "w", 
"w", "w", "s"), t2 = c("w", "s", "s", "s", "s", "w"), t3 = c("w", 
"s", "s", "s", "s", "w"), t4 = c("w", "o", "o", "o", "s", "w"
), t5 = c("w", "o", "w", "o", "s", "w"), t6 = c("w", "w", "w", 
"w", "s", "w"), t7 = c("t", "t", "t", "t", "w", "w"), t8 = c("t", 
"t", "t", "t", "w", "w"), t9 = c("w", "o", "o", "o", "s", "w"
), t10 = c("s", "s", "s", "s", "s", "s")), row.names = c(NA, 
6L), class = "data.frame")