如何在多个列上应用具有多个条件的函数以在R中获得新的条件列
大家好,这里的一个小家伙 我希望你们能在以下方面帮助我 我需要根据原始列中的值多次将数据集中的多个列转换为新列。这意味着,对于第一次转换,我使用列1、2、3,如果满足某些条件,输出结果将是一个新的列,带有1或0,对于第二次转换,我使用列4、5、6,并且输出也应该是1或0。我必须这样做18次。我已经写了一个函数,如果我手动输入变量,它会成功地进行转换,但是我想将这个函数一次应用到所有需要的列。我想要的输出是18个新列,分别为0和1。最后,我将制作最后一列,如果18列中的任何一列是1,则显示1,否则显示0如何在多个列上应用具有多个条件的函数以在R中获得新的条件列,r,loops,multiple-columns,mapply,R,Loops,Multiple Columns,Mapply,大家好,这里的一个小家伙 我希望你们能在以下方面帮助我 我需要根据原始列中的值多次将数据集中的多个列转换为新列。这意味着,对于第一次转换,我使用列1、2、3,如果满足某些条件,输出结果将是一个新的列,带有1或0,对于第二次转换,我使用列4、5、6,并且输出也应该是1或0。我必须这样做18次。我已经写了一个函数,如果我手动输入变量,它会成功地进行转换,但是我想将这个函数一次应用到所有需要的列。我想要的输出是18个新列,分别为0和1。最后,我将制作最后一列,如果18列中的任何一列是1,则显示1,否则
df <- data.frame(admiss1 = sample(seq(as.Date('1990/01/01'), as.Date('2000/01/01'), by="day"), 12),
admiss2 = sample(seq(as.Date('1990/01/01'), as.Date('2000/01/01'), by="day"), 12),
admiss3 = sample(seq(as.Date('1990/01/01'), as.Date('2000/01/01'), by="day"), 12),
visit1 = sample(seq(as.Date('1995/01/01'), as.Date('1996/01/01'), by="day"), 12),
visit2 = sample(seq(as.Date('1997/01/01'), as.Date('1998/01/01'), by="day"), 12),
reason1 = sample(3,12, replace = T),
reason2 = sample(3,12, replace = T),
reason3 = sample(3,12, replace = T))
df$discharge1 <- df$admiss1 + 10
df$discharge2 <- df$admiss2 + 10
df$discharge3 <- df$admiss3 + 10
#every discharge date is 10 days after the admission date for the sake of this example
#now I have the following dataframe
#for the sake of it I included only 3 dates and reasons(instead of 18)
admiss1 admiss2 admiss3 visit1 visit2 reason1 reason2 reason3 discharge1 discharge2 discharge3
1 1990-03-12 1992-04-04 1998-07-31 1995-01-24 1997-10-07 2 1 3 1990-03-22 1992-04-14 1998-08-10
2 1999-05-18 1990-11-25 1995-10-04 1995-03-06 1997-03-13 1 2 1 1999-05-28 1990-12-05 1995-10-14
3 1993-07-16 1998-06-10 1991-07-05 1995-11-06 1997-11-15 1 1 2 1993-07-26 1998-06-20 1991-07-15
4 1991-07-05 1992-06-17 1995-10-12 1995-05-14 1997-05-02 2 1 3 1991-07-15 1992-06-27 1995-10-22
5 1995-08-16 1999-03-08 1992-04-03 1995-02-20 1997-01-03 1 3 3 1995-08-26 1999-03-18 1992-04-13
6 1999-10-07 1991-12-26 1995-05-05 1995-10-24 1997-10-15 3 1 1 1999-10-17 1992-01-05 1995-05-15
7 1998-03-18 1992-04-18 1993-12-31 1995-11-14 1997-06-14 3 2 2 1998-03-28 1992-04-28 1994-01-10
8 1992-08-04 1991-09-16 1992-04-23 1995-05-29 1997-10-11 1 2 3 1992-08-14 1991-09-26 1992-05-03
9 1997-02-20 1990-02-12 1998-03-08 1995-10-09 1997-12-29 1 1 3 1997-03-02 1990-02-22 1998-03-18
10 1992-09-16 1997-06-16 1997-07-18 1995-12-11 1997-01-12 1 2 2 1992-09-26 1997-06-26 1997-07-28
11 1991-01-25 1998-04-07 1999-07-02 1995-12-27 1997-05-28 3 2 1 1991-02-04 1998-04-17 1999-07-12
12 1996-02-25 1993-03-30 1997-06-25 1995-09-07 1997-10-18 1 3 2 1996-03-06 1993-04-09 1997-07-05
admissdate <- function(admis, dis, rsn, vis1, vis2){
xnew <- ifelse(df[eval(substitute(admis))] >= df[eval(substitute(vis1))] & df[eval(substitute(dis))] <= df[eval(substitute(vis2))] & df[eval(substitute(rsn))] == 2, 1, 0)
xnew <- ifelse(df[eval(substitute(admis))] >= df[eval(substitute(vis1))] & df[eval(substitute(admis))] <= df[eval(substitute(vis2))] & df[eval(substitute(dis))] >= df[eval(substitute(vis2))] & df[eval(substitute(rsn))] == 2, 1, xnew)
return(xnew)
}
df您可以将函数更改为接受值而不是列名
admissdate <- function(admis, dis, rsn, vis1, vis2){
xnew <- as.integer(admis >= vis1 & dis <= vis2 & rsn == 2)
xnew <- ifelse(admis >= vis1 & admis <= vis2 & dis >= vis2 & rsn == 2, 1, xnew)
return(xnew)
}
admissdate如果我手动输入变量名,它将起作用
。你能展示一下你是如何手动输入变量的吗?对于这个例子,您的预期输出是什么?3个新列+1个其他列,分别为1和0?因此,如果我手动输入以下内容:“code”df$admis1,这正是我要找的!非常非常感谢。那么,在这种情况下,Map的功能是什么?这是一种将函数应用于多列的方法吗?Map
与mapply
相同。唯一的区别是Map
总是返回列表,而mappy
可能返回列表,也可能不返回列表Map
infact是mapply
的包装器。
admissdate <- function(admis, dis, rsn, vis1, vis2){
xnew <- as.integer(admis >= vis1 & dis <= vis2 & rsn == 2)
xnew <- ifelse(admis >= vis1 & admis <= vis2 & dis >= vis2 & rsn == 2, 1, xnew)
return(xnew)
}
admiss <- paste0("admiss", 1:3)
discharge <- paste0("discharge", 1:3)
reason <- paste0("reason", 1:3)
new_col <- paste0('newcol', 1:3)
df[new_col] <- Map(function(x, y, z) admissdate(x, y, z, df$visit1, df$visit2),
df[admiss],df[discharge],df[reason])
#Additional column will be 1 if any of the value in the new column is 1.
df$result <- as.integer(rowSums(df[new_col]) > 0)
df