Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/loops/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何在多个列上应用具有多个条件的函数以在R中获得新的条件列_R_Loops_Multiple Columns_Mapply - Fatal编程技术网

如何在多个列上应用具有多个条件的函数以在R中获得新的条件列

如何在多个列上应用具有多个条件的函数以在R中获得新的条件列,r,loops,multiple-columns,mapply,R,Loops,Multiple Columns,Mapply,大家好,这里的一个小家伙 我希望你们能在以下方面帮助我 我需要根据原始列中的值多次将数据集中的多个列转换为新列。这意味着,对于第一次转换,我使用列1、2、3,如果满足某些条件,输出结果将是一个新的列,带有1或0,对于第二次转换,我使用列4、5、6,并且输出也应该是1或0。我必须这样做18次。我已经写了一个函数,如果我手动输入变量,它会成功地进行转换,但是我想将这个函数一次应用到所有需要的列。我想要的输出是18个新列,分别为0和1。最后,我将制作最后一列,如果18列中的任何一列是1,则显示1,否则

大家好,这里的一个小家伙

我希望你们能在以下方面帮助我

我需要根据原始列中的值多次将数据集中的多个列转换为新列。这意味着,对于第一次转换,我使用列1、2、3,如果满足某些条件,输出结果将是一个新的列,带有1或0,对于第二次转换,我使用列4、5、6,并且输出也应该是1或0。我必须这样做18次。我已经写了一个函数,如果我手动输入变量,它会成功地进行转换,但是我想将这个函数一次应用到所有需要的列。我想要的输出是18个新列,分别为0和1。最后,我将制作最后一列,如果18列中的任何一列是1,则显示1,否则显示0

    df <- data.frame(admiss1 = sample(seq(as.Date('1990/01/01'), as.Date('2000/01/01'), by="day"), 12),
                     admiss2 = sample(seq(as.Date('1990/01/01'), as.Date('2000/01/01'), by="day"), 12),
                     admiss3 = sample(seq(as.Date('1990/01/01'), as.Date('2000/01/01'), by="day"), 12),
                     visit1 = sample(seq(as.Date('1995/01/01'), as.Date('1996/01/01'), by="day"), 12),
                     visit2 = sample(seq(as.Date('1997/01/01'), as.Date('1998/01/01'), by="day"), 12),
                     reason1 = sample(3,12, replace = T),
                     reason2 = sample(3,12, replace = T),
                     reason3 = sample(3,12, replace = T))
    
    df$discharge1 <- df$admiss1 + 10
    df$discharge2 <- df$admiss2 + 10
    df$discharge3 <- df$admiss3 + 10
#every discharge date is 10 days after the admission date for the sake of this example
    
#now I have the following dataframe
#for the sake of it I included only 3 dates and reasons(instead of 18)
          admiss1    admiss2    admiss3     visit1     visit2 reason1 reason2 reason3 discharge1 discharge2 discharge3
    1  1990-03-12 1992-04-04 1998-07-31 1995-01-24 1997-10-07       2       1       3 1990-03-22 1992-04-14 1998-08-10
    2  1999-05-18 1990-11-25 1995-10-04 1995-03-06 1997-03-13       1       2       1 1999-05-28 1990-12-05 1995-10-14
    3  1993-07-16 1998-06-10 1991-07-05 1995-11-06 1997-11-15       1       1       2 1993-07-26 1998-06-20 1991-07-15
    4  1991-07-05 1992-06-17 1995-10-12 1995-05-14 1997-05-02       2       1       3 1991-07-15 1992-06-27 1995-10-22
    5  1995-08-16 1999-03-08 1992-04-03 1995-02-20 1997-01-03       1       3       3 1995-08-26 1999-03-18 1992-04-13
    6  1999-10-07 1991-12-26 1995-05-05 1995-10-24 1997-10-15       3       1       1 1999-10-17 1992-01-05 1995-05-15
    7  1998-03-18 1992-04-18 1993-12-31 1995-11-14 1997-06-14       3       2       2 1998-03-28 1992-04-28 1994-01-10
    8  1992-08-04 1991-09-16 1992-04-23 1995-05-29 1997-10-11       1       2       3 1992-08-14 1991-09-26 1992-05-03
    9  1997-02-20 1990-02-12 1998-03-08 1995-10-09 1997-12-29       1       1       3 1997-03-02 1990-02-22 1998-03-18
    10 1992-09-16 1997-06-16 1997-07-18 1995-12-11 1997-01-12       1       2       2 1992-09-26 1997-06-26 1997-07-28
    11 1991-01-25 1998-04-07 1999-07-02 1995-12-27 1997-05-28       3       2       1 1991-02-04 1998-04-17 1999-07-12
    12 1996-02-25 1993-03-30 1997-06-25 1995-09-07 1997-10-18       1       3       2 1996-03-06 1993-04-09 1997-07-05
    
    admissdate <- function(admis, dis, rsn, vis1, vis2){
      xnew <- ifelse(df[eval(substitute(admis))] >= df[eval(substitute(vis1))] & df[eval(substitute(dis))] <= df[eval(substitute(vis2))] & df[eval(substitute(rsn))] == 2, 1, 0)
      xnew <- ifelse(df[eval(substitute(admis))] >= df[eval(substitute(vis1))] & df[eval(substitute(admis))] <= df[eval(substitute(vis2))] & df[eval(substitute(dis))] >= df[eval(substitute(vis2))] & df[eval(substitute(rsn))] == 2, 1, xnew)
      return(xnew)
    }

df您可以将函数更改为接受值而不是列名

admissdate <- function(admis, dis, rsn, vis1, vis2){
  xnew <- as.integer(admis >= vis1 & dis <= vis2 & rsn == 2)
  xnew <- ifelse(admis >= vis1 & admis <= vis2 & dis >= vis2 & rsn == 2, 1, xnew)
  return(xnew)
}

admissdate
如果我手动输入变量名,它将起作用
。你能展示一下你是如何手动输入变量的吗?对于这个例子,您的预期输出是什么?3个新列+1个其他列,分别为1和0?因此,如果我手动输入以下内容:“code”df$admis1,这正是我要找的!非常非常感谢。那么,在这种情况下,Map的功能是什么?这是一种将函数应用于多列的方法吗?
Map
mapply
相同。唯一的区别是
Map
总是返回列表,而
mappy
可能返回列表,也可能不返回列表
Map
infact是
mapply
的包装器。
admissdate <- function(admis, dis, rsn, vis1, vis2){
  xnew <- as.integer(admis >= vis1 & dis <= vis2 & rsn == 2)
  xnew <- ifelse(admis >= vis1 & admis <= vis2 & dis >= vis2 & rsn == 2, 1, xnew)
  return(xnew)
}
admiss <- paste0("admiss", 1:3)
discharge <- paste0("discharge", 1:3)
reason <- paste0("reason", 1:3)
new_col <- paste0('newcol', 1:3)

df[new_col] <- Map(function(x, y, z) admissdate(x, y, z, df$visit1, df$visit2), 
                   df[admiss],df[discharge],df[reason])
#Additional column will be 1 if any of the value in the new column is 1.
df$result <- as.integer(rowSums(df[new_col]) > 0)
df