R 仅返回基于另一个变量的变量的第一个实例_R

R 仅返回基于另一个变量的变量的第一个实例

R 仅返回基于另一个变量的变量的第一个实例,r,R,我有一个ID列表（有些是重复的），还有一个KEEP变量。如果KEEP列中有一个实例，我想创建一个1或0的列，即使它不是那个特定的列 id <- c(101,101,101,102,102,102,103,103,103,104,104,106,107,108) keep <- c("Y",0,0,"Y",0 ,0 ,"Y" ,0 ,0 ,0 ,0 ,0 ,0 ,0) df <- data.frame(id, keep) 库（dplyr） df%>%group_by（id）%>

我有一个ID列表（有些是重复的），还有一个

KEEP

变量。如果KEEP列中有一个实例，我想创建一个1或0的列，即使它不是那个特定的列

id <- c(101,101,101,102,102,102,103,103,103,104,104,106,107,108)
keep <- c("Y",0,0,"Y",0 ,0 ,"Y" ,0 ,0 ,0 ,0 ,0 ,0 ,0)
df <- data.frame(id, keep)

库（dplyr）
df%>%group_by（id）%>%mutate（countkeep=ifelse（any（keep==“Y”），1,0））
我要继续计数
101Y1
2    101      0         1
3    101      0         1
4 102 Y 1
5    102      0         1
6    102      0         1
7 103 Y 1
8    103      0         1
9    103      0         1
10   104      0         0
11   104      0         0
12   106      0         0
13   107      0         0
14   108      0         0

我们可以使用

数据表
library(data.table)
setDT(df)[, countkeep := +(any(keep=="Y")), id]
df
#     id keep countkeep
# 1: 101    Y         1
# 2: 101    0         1
# 3: 101    0         1
# 4: 102    Y         1
# 5: 102    0         1
# 6: 102    0         1
# 7: 103    Y         1
# 8: 103    0         1
# 9: 103    0         1
#10: 104    0         0
#11: 104    0         0
#12: 106    0         0
#13: 107    0         0
#14: 108    0         0

transform(df, countkeep = +(id %in% names(na.omit(NA^!table(df)[,"Y"]))))


或使用base R

df$countkeep <- with(df, as.integer(ave(keep=="Y", id, FUN = any)))

如果你想要一个基本答案，这个答案也应该有效
df$countkeep <- ifelse(df$id %in% df$id[which(df$keep == "Y")], 1, 0)

> df
    id keep countkeep
1  101    Y         1
2  101    0         1
3  101    0         1
4  102    Y         1
5  102    0         1
6  102    0         1
7  103    Y         1
8  103    0         1
9  103    0         1
10 104    0         0
11 104    0         0
12 106    0         0
13 107    0         0
14 108    0         0

df$countkeep df
我要继续计数
101Y1
2  101    0         1
3  101    0         1
4 102 Y 1
5  102    0         1
6  102    0         1
7 103 Y 1
8  103    0         1
9  103    0         1
10 104    0         0
11 104    0         0
12 106    0         0
13 107    0         0
14 108    0         0
也许有一种更优雅的方法可以做到这一点，但这是可行的：
df$countkeep <- apply(df,1,function(x){
  if(nrow(subset(df,id==x[1] & keep=="Y"))==1)
    1
  else
    0
})

df$countkeep这正是我所需要的，它在dplyr中非常有效，我也很喜欢。干得好。谢谢当用户投反对票时，也请分享原因。这会很有帮助
df$countkeep <- ifelse(df$id %in% df$id[which(df$keep == "Y")], 1, 0)

> df
    id keep countkeep
1  101    Y         1
2  101    0         1
3  101    0         1
4  102    Y         1
5  102    0         1
6  102    0         1
7  103    Y         1
8  103    0         1
9  103    0         1
10 104    0         0
11 104    0         0
12 106    0         0
13 107    0         0
14 108    0         0

df$countkeep <- apply(df,1,function(x){
  if(nrow(subset(df,id==x[1] & keep=="Y"))==1)
    1
  else
    0
})